전략적 LLM 훈련: 수학적 추론에서 멀티 토큰 예측의 데이터 효율성

이 수치는 GSM8K에서 다중 토큰 예측 모델의 성능에 대한 훈련 규모의 심오한 영향을 보여주며, 수학적 추론을 위한 중요한 데이터 효율성 고려 사항을 강조합니다.