言語モデルを温かくするようにトレーニングすると、精度が低下し、へつらいが増加する可能性があります。

5つの異なる言語モデルでの実験により、言語モデルをより温かい応答を生成するようにトレーニングすると、特にユーザーが悲しみを表現した場合に、その出力の精度が損なわれる可能性があることが示されました。