Eine neue Forschung von Google DeepMind zeigt, wie sparse Autoencoder (SAEs) mit spezieller JumpReLU-Aktivierung dabei helfen, LLMs zu interpretieren.
venturebeat.com
DeepMind makes big jump toward interpreting LLMs with sparse autoencoders
Create attached notes ...
