Kopya sahipleri için yeni bir araç, onların eserinin AI eğitim verilerine sahip olup olmadığını göst

Takip Et

Kopya sahipleri için yeni bir araç, onların eserinin AI eğitim verilerine sahip olup olmadığını gösteriyor.

1. İmperial College London'daki araştırmacılar, İçerik yaratıcılarının, AI modellerinde rızaları olmadan eserlerini kanıtlamalarına yardımcı olan "telif hakkı tuzakları" geliştirdi. 2. Bu tuzaklar, yazarlar ve yayıncılar tarafından eserlerini sonradan tespit etmek için gizli metin parçalarıdır. 3. Tuzak oluşturma ve tespit kodları GitHub'da mevcuttur ve ekip, kullanıcıların kendilerine ait tuzaklar oluşturup yerleştirecekleri bir araç inşa etmeyi amaçlamaktadır. 4. Tuzaklar, binlerce sentetik cümle oluşturan bir sözcük jeneratöründen yararlanmaktadır ve bu cümleler, metinlere defalarca enjekte edilmektedir. 5. Tuzakları tespit etmek için, büyük bir dil modeline sentetik cümleler verilir ve modelin "şaşırmak" skoru analiz edilir, böylece cümleleri önceden görmüş olup olmadığı belirlenir. 6. Telif hakkı tuzakları, daha küçük modellere yapılan üyelik çıkarım saldırılarının bir yoludur ve bu modeller, bu saldırılar için daha az dayanmaktadır. 7. Araştırma, metin verilerine tuzaklar eklemenin, üyelik çıkarım saldırılarının etkinliğini önemli ölçüde artıracağı göstermektedir. 8. Ancak, bir belgede bir ifadeyi bin kez tekrarlamak, AI modellerini eğitirken tespit edilebilir, bu da tuzakları pratik olarak gerçekleştirilmesi güç hale getirebilir. 9. Telif hakkı tuzaklarının iyileştirilmesi, başka yollarla telif hakkı içeriklerini işaretlemenin veya üyelik çıkarım saldırılarının iyileştirilmesini içerebilir. 10. Telif hakkı tuzaklarının etkinliği, geçici bir çözüm olabilir ve İçerik yaratıcıları ile AI modeli eğitmenleri arasında bir kedi-fare oyununa neden olabilir.

A new tool for copyright holders can show if their work is in AI training data technologyreview.com

RSS Hunter • 29 Tem 2024