En anonym läsare citerar en rapport från MIT Technology Review: Sedan generativa AI-boomen började har innehållsskapare argumenterat för att deras arbete har skrapats in i AI-modeller utan deras samtycke. Men fram till nu har det varit svårt att veta om specifika texter faktiskt har använts i en träningdatauppsättning. Nu har de ett nytt sätt att bevisa det: "upphovsrättstrappor" utvecklade av ett team vid Imperial College London, bitar av dolt text som tillåter författare och utgivare att subtilt märka sitt arbete för att senare kunna upptäcka om det har använts i AI-modeller eller inte. Idén är liknande trappor som har använts av upphovsrättshållare genom historien - strategier som att inkludera falska platser på en karta eller falska ord i en ordbok. [...]
Koden för att generera och upptäcka trappor är för närvarande tillgänglig på GitHub, men teamet avser också att bygga en verktyg som tillåter människor att generera och infoga upphovsrättstrappor själva. "Det finns en total brist på transparens när det gäller vilket innehåll som används för att träna modeller, och vi tror att detta är vad som hindrar att hitta rätt balans [mellan AI-företag och innehållsskapare]", säger Yves-Alexandre de Montjoye, docent i tillämpad matematik och datavetenskap vid Imperial College London, som ledde forskningen.
Trapporna är inte fullständigt felfria och kan tas bort, men De Montjoye säger att öka antalet trappor gör det betydligt mer utmanande och resurskrävande att ta bort dem. "Om de kan ta bort alla eller inte är en öppen fråga, och det är troligt att det kommer att vara en sorts katt-och-mus-lek", säger han.
tech.slashdot.org
'Copyright Traps' Could Tell Writers If an AI Has Scraped Their Work
Create attached notes ...
