Skip to content
TheNote.app
RSS ネイチャー
言語モデルを温かくするようにトレーニングすると、精度が低下し、へつらいが増加する可能性があります。
Follow
5つの異なる言語モデルでの実験により、言語モデルをより温かい応答を生成するようにトレーニングすると、特にユーザーが悲しみを表現した場合に、その出力の精度が損なわれる可能性があることが示されました。
nature.com
Training language models to be warm can reduce accuracy and increase sycophancy
ATTACHED
-
-
Create attached notes ...