익명 리더는 MIT 테크놀로지 리뷰에서報道한 바에 따르면: 생성적 AI 붐이 시작된 이래로 콘텐츠 크리에이터들은 그들의 작품이 AI 모델에 무단으로 스크랩되는 것에 대해 항의해 왔다. 그러나 이제까지는 특정 텍스트가 실제로 훈련 데이터 세트에 사용되었는지 알 수 없었다. 이제 그들은 새로운 방법으로 이를 증명할 수 있다: 런던 제국 대학에서 개발한 "저작권 트랩", 작가와 출판사들이 그들의 작품을 마킹하여 나중에 AI 모델에서 사용되었는지 확인할 수 있도록 하는 숨겨진 텍스트다.
이 아이디어는 역사를 통해 저작권 보유자들이 사용해 온 트랩과 비슷하다. 예를 들어 지도에 가짜 위치를 추가하거나 사전에 가짜 단어를 추가하는 전략이 있다. [...]
트랩을 생성하고 감지하는 코드는 현재 GitHub에서 사용할 수 있지만, 팀은 또한 사람들이 저작권 트랩을 생성하고 삽입할 수 있는 도구를 구축할 계획이다. "AI 모델을 훈련하는 데 사용되는 콘텐츠에 대한 투명성이 완전히 부족하고, 우리는 이를 통해 콘텐츠 크리에이터와 AI 회사의 올바른 균형을 찾을 수 없다고 생각합니다."라고 런던 제국 대학에서 응용 수학과 컴퓨터 과학 부교수인 이브스-알렉산드르 드 몽주아는 말했다.
트랩은 완벽하지 않으며 제거할 수 있지만 드 몽주아는 트랩의 수가 증가하면 이를 제거하는 것이 훨씬 더 어려워진다고 말했다. "그들이 모든 트랩을 제거할 수 있는지 여부는 열린 질문이고, 이는 약간의 고양이와 쥐의 게임이 될 것입니다."
tech.slashdot.org
'Copyright Traps' Could Tell Writers If an AI Has Scraped Their Work
Create attached notes ...
