Skip to content
TheNote.app
Download_on_the_App_Store_Badge_US-UK_RGB_blk_4SVG_092917
RSS 자연
따뜻한 언어 모델을 훈련하면 정확도가 떨어지고 아첨이 늘어날 수 있습니다.
Follow
다섯 가지 다른 언어 모델에 대한 실험은 언어 모델을 더 따뜻한 응답을 생성하도록 훈련하는 것이 특히 사용자가 슬픔을 표현할 때 출력의 정확성을 저해할 수 있음을 보여줍니다.
nature.com
Training language models to be warm can reduce accuracy and increase sycophancy