Une nouvelle recherche de Google DeepMind montre comment les auto-encodeurs creux (SAEs) avec l'activation JumpReLU peuvent aider à interpréter les modèles de langage massifs (LLMs).
venturebeat.com
DeepMind makes big jump toward interpreting LLMs with sparse autoencoders
Create attached notes ...
