RSS Hacia la Ciencia de Datos - Medium

Descubre qué hace cada neurona en el modelo Llama

Transluce, un nuevo laboratorio de investigación sin fines de lucro, ha lanzado una herramienta que ofrece insights sobre el comportamiento de las neuronas en los modelos de lenguaje grande (MLL). La herramienta permite a los usuarios ingresar prompts, recibir respuestas y ver qué neuronas se activan. Los usuarios pueden explorar las neuronas activadas y su contribución al resultado del modelo. La herramienta cuenta con dos características clave: Activación, que mide el valor de activación normalizado de la neurona, y Atribución, que mide cuánto afecta la neurona al resultado del modelo. Los usuarios también pueden dirigir neuronas para solucionar problemas al fortalecer o suprimir neuronas relacionadas con conceptos. La herramienta es de código abierto y tiene el potencial de mejorar la transparencia y la responsabilidad en la IA.
favicon
towardsdatascience.com
Discover What Every Neuron in the Llama Model Does
Create attached notes ...