简体中文版人工智能和 ML 新闻 关注 DeepMind 使用稀疏自编码器大幅推进LLM解释 Google DeepMind 的一项新研究表明,稀疏自动编码器(SAEs)与特殊的 JumpReLU 激活函数如何帮助解释大型语言模型(LLMs)。 DeepMind makes big jump toward interpreting LLMs with sparse autoencoders venturebeat.com