Notizie su AI e ML in italiano

Un nuovo strumento per i titolari di diritti d'autore può mostrare se il loro lavoro è nei dati di addestramento AI

1. I ricercatori del College Imperial di Londra hanno sviluppato "trappole per il copyright" per aiutare i creatori di contenuti a dimostrare che il loro lavoro è stato utilizzato nei modelli di IA senza il loro consenso. 2. Queste trappole sono pezzi di testo nascosti che permettono agli scrittori e agli editori di marchiare sottilmente il loro lavoro per la rilevazione successiva. 3. Il codice per generare e rilevare le trappole è disponibile su GitHub, e il team pianifica di costruire uno strumento per gli utenti per creare e inserire le loro trappole. 4. Le trappole utilizzano un generatore di parole per creare migliaia di frasi sintetiche, che vengono quindi iniettate in un testo multiple volte. 5. Per rilevare le trappole, un grande modello di linguaggio viene alimentato con le frasi sintetiche e il suo punteggio di "sorpresa" viene analizzato per determinare se ha visto le frasi prima. 6. Le trappole per il copyright sono un modo per eseguire attacchi di inferenza di appartenenza su modelli più piccoli, che sono meno suscettibili a questi attacchi. 7. La ricerca mostra che l'introduzione di trappole nei dati di testo può aumentare significativamente l'efficacia degli attacchi di inferenza di appartenenza. 8. Tuttavia, ripetere una frase 1.000 volte in un documento potrebbe essere rilevato da coloro che addestrano i modelli di IA, rendendo le trappole potenzialmente impraticabili. 9. Migliorare le trappole per il copyright potrebbe coinvolgere la ricerca di altri modi per marchiare il contenuto protetto da copyright o migliorare gli attacchi di inferenza di appartenenza. 10. L'efficacia delle trappole per il copyright potrebbe essere una soluzione temporanea e potrebbe portare a un gioco del gatto e del topo tra i creatori di contenuti e gli addestratori di modelli di IA.
favicon
technologyreview.com
A new tool for copyright holders can show if their work is in AI training data
Create attached notes ...