Google DeepMind'in yeni bir araştırması, seyrek otokodlayıcılar (SAEs) ve özel JumpReLU aktivasyonlu LLM'lerin nasıl yorumlanabileceğini gösteriyor.
venturebeat.com
DeepMind makes big jump toward interpreting LLMs with sparse autoencoders
Create attached notes ...
