Actualités de l'IA et du ML en français

Le géant de la GPU GeForce a été en train de collecter des données à partir de vidéos pendant 80 ans chaque jour pour l'entraînement de l'IA à Nvidia, afin de 'déverrouiller diverses applications en aval critiques pour Nvidia'.

Des documents divulgués révèlent l'utilisation extensive de vidéos YouTube, Netflix et d'autres sources par Nvidia pour entraîner un modèle d'IA pour son Omniverse, des véhicules autonomes et des avatars numériques. Cette opération de collecte de données, détaillée par 404 Media, impliquait un projet interne nommé Cosmos, où Nvidia utilisait des PC virtuels sur AWS pour télécharger plus de 30 millions d'URL en un mois. Les employés discutaient de préoccupations en matière de droits d'auteur, trouvaient des moyens d'éviter les violations directes, comme utiliser le service cloud de Google pour télécharger le jeu de données YouTube-8M. Nvidia affirmait être en conformité avec les lois sur le droit d'auteur, malgré l'utilisation de certains jeux de données destinés uniquement à des fins académiques pour des objectifs commerciaux. Nvidia n'est pas seul dans cette pratique, avec OpenAI et Runway également accusés d'utiliser des matériaux protégés pour l'entraînement de l'IA. Il est intéressant de noter que Nvidia a rencontré des difficultés pour utiliser des images de gameplay provenant de son service GeForce Now en raison de problèmes techniques et réglementaires. Les modèles d'IA nécessitent de vastes quantités de données, soulevant des questions sur la légalité de l'utilisation de matériaux protégés et de données personnelles. Dans l'UE, le RGPD réglemente strictement l'utilisation des données personnelles, posant des risques juridiques potentiels pour des entreprises comme Nvidia. Il y a un besoin croissant de transparence dans les pratiques d'entraînement de l'IA pour assurer la responsabilité et l'adéquation aux normes légales.
www.pcgamer.com
GeForce GPU giant has been data scraping 80 years' worth of videos every day for AI training to 'unlock various downstream applications critical to Nvidia'
Create attached notes ...