Uma nova pesquisa da Google DeepMind mostra como autoencoders esparsos (SAEs) com ativação JumpReLU especial podem ajudar a interpretar LLMs.
venturebeat.com
DeepMind makes big jump toward interpreting LLMs with sparse autoencoders
Create attached notes ...
