Uusi työkalu tekijänoikeuden haltijoille näyttää, onko heidän työtään käytetty AI-koulutusdatassa

Seuraa

Uusi työkalu tekijänoikeuden haltijoille näyttää, onko heidän työtään käytetty AI-koulutusdatassa

1. Imperial College Londonin tutkijat ovat kehittäneet "tekijänoikeustrapit" avatakseen sisällöntuottajille, että heidän työtä on käytetty AI-malleissa heidän suostumuksensa ulkopuolella. 2. Nämä trapat ovat piilotettuja tekstejä, joita kirjailijat ja kustantajat voivat käyttää merkikseen työtä myöhemmin havaitsemiseksi. 3. Trappien generointi- ja havaitsemiskoodi on saatavilla GitHubissa, ja tiimi aikoo rakentaa työkalun, jota käyttäjät voivat käyttää omien trappien luomiseen ja sisällyttämiseen. 4. Trapat käyttävät sanageneraattoria, joka luo tuhansia synteettisiä lauseita, jotka sitten lisätään tekstiin useita kertoja. 5. Trappien havaitsemiseksi suuri kielimalli syötetään synteettisiin lauseisiin, ja sen "yläri" -piste on analysoitava, jotta voidaan määrittää, onko se nähnyt lauseet aikaisemmin. 6. Tekijänoikeustrapit ovat tapa toteuttaa jäsenyysinferenssia hyökkäyksiä pienempiin malleihin, jotka ovat vähemmän alttiita näille hyökkäyksille. 7. Tutkimus osoittaa, että trappien sisällyttäminen tekstidataan voi merkittävästi lisätä jäsenyysinferenssia hyökkäyksien tehokkuutta. 8. Kuitenkin lauseen toistaminen 1 000 kertaa dokumentissa voidaan havaita, kun koulutetaan AI-malleja, mikä tekee trapeista potentiaalisesti käytännössä soveltamiskelvottomia. 9. Trappien parantaminen voisi olla muuten merkittyä tekijänoikeusmateriaalia tai jäsenyysinferenssia hyökkäyksien tehostaminen. 10. Tekijänoikeustrapin tehokkuus saattaa olla väliaikainen ratkaisu ja johtaa kissa-ja-hiiri-peliin sisällöntuottajien ja AI-mallien kouluttajien välillä.

A new tool for copyright holders can show if their work is in AI training data technologyreview.com

RSS Hunter • 29.7.2024