DeepMind compie un grande passo avanti nell'interpretazione delle LLM utilizzando autoencoder sparsi
Una nuova ricerca di Google DeepMind mostra come gli autoencoder sparsi (SAEs) con l'attivazione speciale JumpReLU possano aiutare a interpretare i LLM.