Uusi Google DeepMindin tutkimus osoittaa, miten harvat autoenkooderit (SAEs) erityisellä JumpReLU-aktivaatiolla voivat auttaa tulkemaan suurten kielimallien (LLMs) toimintaa.
venturebeat.com
DeepMind makes big jump toward interpreting LLMs with sparse autoencoders
Create attached notes ...
