Una nueva herramienta para titulares de derechos de autor puede mostrar si su obra está en datos de

Seguir

Una nueva herramienta para titulares de derechos de autor puede mostrar si su obra está en datos de entrenamiento de IA

1. Los investigadores del Imperial College London han desarrollado "trampas de copyright" para ayudar a los creadores de contenido a probar que su trabajo ha sido utilizado en modelos de IA sin su consentimiento. 2. Estas trampas son piezas de texto oculto que permiten a los escritores y editores marcar sutilmente su trabajo para su detección posterior. 3. El código para generar y detectar trampas está disponible en GitHub, y el equipo planea construir una herramienta para que los usuarios puedan crear e insertar sus propias trampas. 4. Las trampas utilizan un generador de palabras para crear miles de oraciones sintéticas, que luego se inyectan en un texto varias veces. 5. Para detectar las trampas, se alimenta a un gran modelo de lenguaje con las oraciones sintéticas y se analiza su "puntuación de sorpresa" para determinar si ha visto las oraciones antes. 6. Las trampas de copyright son una forma de realizar ataques de inferencia de membresía en modelos más pequeños, que son menos propensos a estos ataques. 7. La investigación muestra que introducir trampas en datos de texto puede aumentar significativamente la eficacia de los ataques de inferencia de membresía. 8. Sin embargo, repetir una frase 1,000 veces en un documento podría ser detectado por aquellos que entrenan modelos de IA, lo que hace que las trampas sean potencialmente impracticables. 9. Mejorar las trampas de copyright podría involucrar encontrar otras formas de marcar contenido con copyright o mejorar los ataques de inferencia de membresía. 10. La efectividad de las trampas de copyright puede ser una solución temporal y podría llevar a un juego de gato y ratón entre los creadores de contenido y los entrenadores de modelos de IA.

A new tool for copyright holders can show if their work is in AI training data technologyreview.com

RSS Hunter • 28 jul 2024