구글, LLM 자가수정 알고리즘 SCoRe 공개

구글 딥마인드의 연구진은 최근에 SCoRe(Self-Correction via Reinforcement Learning)라는 기법에 대한 논문을 발표했습니다. SCoRe는 수학이나 코딩 문제를 해결할 때 대형 언어 모델(LLMs)의 자가 수정 능력을 향상시키는 기술입니다. SCoRe로 미세 조정된 모델은 기준 모델에 비해 여러 벤치마크에서 성능이 향상되었습니다. - 앤서니 알포드