DeepMind faz grande salto em direção à interpretação de LLMs com autoencoders esparsos

Seguir

Uma nova pesquisa da Google DeepMind mostra como autoencoders esparsos (SAEs) com ativação JumpReLU especial podem ajudar a interpretar LLMs.

RSS Hunter • 28 de jul. de 2024