Новое исследование от Google DeepMind демонстрирует, как разреженные автоэнкодеры (SAE) со специальной активацией JumpReLU могут помочь в интерпретации больших языковых моделей (LLM).
venturebeat.com
DeepMind makes big jump toward interpreting LLMs with sparse autoencoders
Create attached notes ...
