Anthropic:
研究者らが、「潜在学習」について詳細に説明しています。これは、言語モデルが、それらの特性とは意味的に関連性のないモデル生成データから特性を学習する現象です。私たちは、「潜在学習」を研究しています。これは、言語モデルが、それらの特性とは意味的に関連性のないモデル生成データから特性を学習するという驚くべき現象です。
techmeme.com
Researchers detail "subliminal learning", where LLMs learn traits from model-generated data that is semantically unrelated to those traits (Anthropic)
