Sızdırılan belgeler, Nvidia'nın Omniverse, otonom araçlar ve dijital avatarlar için bir AI modelini eğitme amaçlı olarak YouTube videoları, Netflix ve diğer kaynaklardan geniş çaplı olarak kullandığını ortaya koyuyor. Bu veri kazıma operasyonu, 404 Media tarafından ayrıntılandırıldı ve Nvidia'nın Cosmos adlı dahili bir projesinde yapıldı. Burada Nvidia, AWS'de sanal PC'ler kullanarak bir ayda 30 milyondan fazla URL indirdi. Çalışanlar, telif hakkı endişeleriyle ilgili olarak doğrudan ihlallerden kaçınmak için yollar buldu, örneğin YouTube-8M veri setini indirmek için Google'ın bulut hizmetini kullanarak. Nvidia, telif hakkı yasalarına uyduğunu iddia etti, ancak ticari amaçlar için akademik amaçlar için amaçlanan bazı veri setlerini kullanarak. Nvidia, bu uygulamada yalnız değildir, OpenAI ve Runway'in de korunan malzemeleri AI eğitimi için kullandığı iddia ediliyor. İlginç bir şekilde, Nvidia, GeForce Now hizmetinden oyun oynama görüntülerini kullanarak karşılaştığı mühendislik ve düzenleyici güçlüklerle karşılaştı. AI modelleri, büyük miktarda veriye ihtiyaç duyuyor, bu da Nvidia gibi şirketler için telif hakkı yasalarına uyumu ve kişisel veri kullanımını takip eden yasal riskleri gündeme getiriyor. AB'de GDPR, kişisel veri kullanımını sıkı bir şekilde düzenlediği için, Nvidia gibi şirketler için potansiyel yasal riskler oluşturuyor. AI eğitimi uygulamalarında şeffaflık için artan bir ihtiyaç var, hesap verebilirlik ve yasal standartlara uyumu sağlamak için.
www.pcgamer.com
GeForce GPU giant has been data scraping 80 years' worth of videos every day for AI training to 'unlock various downstream applications critical to Nvidia'
Create attached notes ...