Un lector anónimo cita un informe de MIT Technology Review: Desde el comienzo de la explosión de la IA generativa, los creadores de contenido han argumentado que su trabajo ha sido recopilado en modelos de IA sin su consentimiento. Pero hasta ahora, ha sido difícil determinar si un texto específico realmente se ha utilizado en un conjunto de datos de entrenamiento. Ahora tienen una nueva forma de probarlo: "trampas de copyright" desarrolladas por un equipo del Imperial College de Londres, piezas de texto oculto que permiten a los escritores y editores marcar sutilmente su trabajo para detectar posteriormente si ha sido utilizado en modelos de IA o no. La idea es similar a trampas que han sido utilizadas por titulares de derechos de autor a lo largo de la historia - estrategias como incluir ubicaciones falsas en un mapa o palabras falsas en un diccionario. [...]
El código para generar y detectar trampas está actualmente disponible en GitHub, pero el equipo también tiene la intención de construir una herramienta que permita a las personas generar y insertar trampas de copyright ellos mismos. "Hay una completa falta de transparencia en cuanto a qué contenido se utiliza para entrenar modelos, y creemos que esto está impidiendo encontrar el equilibrio adecuado [entre las empresas de IA y los creadores de contenido]", dice Yves-Alexandre de Montjoye, profesor asociado de matemáticas aplicadas y ciencias de la computación en el Imperial College de Londres, quien lideró la investigación.
Las trampas no son infalibles y se pueden eliminar, pero De Montjoye dice que aumentar el número de trampas hace que sea significativamente más desafiante y costoso en recursos eliminarlas. "Si pueden eliminar todas ellas o no es una pregunta abierta, y eso probablemente sea un juego de gato y ratón", dice.
tech.slashdot.org
'Copyright Traps' Could Tell Writers If an AI Has Scraped Their Work
Create attached notes ...
