DeepMind erzielt großen Fortschritt bei der Interpretation von LLMs mit sparßen Autoencodern

Folgen

DeepMind erzielt großen Fortschritt bei der Interpretation von LLMs mit sparßen Autoencodern

Eine neue Forschung von Google DeepMind zeigt, wie sparse Autoencoder (SAEs) mit spezieller JumpReLU-Aktivierung dabei helfen, LLMs zu interpretieren.

DeepMind makes big jump toward interpreting LLMs with sparse autoencoders venturebeat.com

RSS Hunter • 28. Juli 2024