AI 및 ML 뉴스

GeForce GPU 거인은 매일 80년 분량의 비디오를 데이터 스크래핑하여 AI 훈련을 통해 Nvidia에게 중요한 다양한 다운스트림 애플리케이션을 '잠금 해제'하고 있습니다.

누리다 문서는 Nvidia가 YouTube 비디오, Netflix 및 기타 소스에서 Omniverse, 자율 주행 차량 및 디지털 아바타르를 위한 AI 모델을 훈련하는 데 광범위하게 사용했음을 보여준다. 404 Media에 따르면 Nvidia는 Cosmos라는 내부 프로젝트에서 AWS에서 가상 PC를 사용하여 한 달 동안 30만 개 이상의 URL을 다운로드했다. 직원들은 저작권 문제에 대해 논의했으며, 직접적인 위반을 피하는 방법을 찾았다. 예를 들어 Google의 클라우드 서비스를 사용하여 YouTube-8M 데이터셋을 다운로드하는 등이다. Nvidia는 저작권 법률을 준수하고 있다고 주장했지만, 학술 목적으로만 사용할 예정인 일부 데이터셋을 상업적 목적으로 사용했다. Nvidia만이 이러한 관행을 따르지 않는다. OpenAI와 Runway도 보호된 자료를 AI 훈련에 사용한 혐의를 받고 있다. 흥미롭게도 Nvidia는 GeForce Now 서비스에서 게임 플레이 푸터를 사용하는 데 엔지니어링 및 규제 문제로 어려움을 겪고 있다. AI 모델은 엄청난 양의 데이터를 필요로 하며, 저작권 물질 및 개인 데이터 사용의 법적 문제를 제기하고 있다. EU에서는 GDPR가 개인 데이터 사용을 엄격하게 규제하고 있으므로 Nvidia와 같은 회사는 법적 위험에 직면할 수 있다. AI 훈련 관행에 대한 투명성이 필요하여 책임을 지고 법적 표준을 준수할 수 있도록 한다.
www.pcgamer.com
GeForce GPU giant has been data scraping 80 years' worth of videos every day for AI training to 'unlock various downstream applications critical to Nvidia'
Create attached notes ...