En ny studie av Google DeepMind visar hur sällsynta autoencoders (SAEs) med special JumpReLU-aktivering kan hjälpa till att tolka stora språkmodeller (LLMs).
venturebeat.com
DeepMind makes big jump toward interpreting LLMs with sparse autoencoders
Create attached notes ...
