1. 런던 제국 대학의 연구자들은 AI 모델에서 저작권자의 동의 없이 콘텐츠가 사용되는 것을 증명하는 데 도움이 되는 "저작권 트랩"을 개발했습니다.
2. 이러한 트랩은 작가와 출판사들이 나중에 검출할 수 있도록 조용히 콘텐츠를 표시하는 숨겨진 텍스트 조각입니다.
3. 트랩 생성 및 감지 코드는 GitHub에서 사용할 수 있으며, 팀은 사용자가 자체 트랩을 생성하고 삽입하는 도구를 구축할 계획입니다.
4. 트랩은 문장 생성기를 사용하여 수천 개의 합성 문장을 생성하고, 이를 텍스트에 여러 번 주입합니다.
5. 트랩을 감지하려면 대규모 언어 모델에 합성 문장을 공급하고, 모델이 문장을 전에 본 적이 있는지 확인하는 "놀라움" 점수를 분석합니다.
6. 저작권 트랩은 더 작은 모델에서 멤버쉽 추론 공격을 수행하는 방법입니다. 이러한 모델은 이러한 공격에 덜 취약합니다.
7. 연구는 텍스트 데이터에 트랩을 도입하면 멤버쉽 추론 공격의 효율성을 크게 향상시킬 수 있음을 보여줍니다.
8. 그러나 문서에서 문장을 1,000번 반복하는 것은 AI 모델을 훈련하는 사람들에게 감지될 수 있습니다. 이렇게 하면 트랩이 실제로는 사용할 수 없을 수 있습니다.
9. 저작권 트랩을 개선하는 방법은 다른 방법으로 저작권 콘텐츠를 표시하거나 멤버쉽 추론 공격을 향상하는 것입니다.
10. 저작권 트랩의 효율성은 일시적인 해결책일 수 있으며 콘텐츠 창작자와 AI 모델 훈련자 간의 고양이와 쥐 게임을 초래할 수 있습니다.
technologyreview.com
A new tool for copyright holders can show if their work is in AI training data
Create attached notes ...
