다중 토큰 예측: LLMs의 훈련-추론 불일치 해소

우리는 다중 토큰 예측이 특히 더 큰 모델과 코드 작업에 대해 분포 불일치 줄임으로써 LLM 성능을 향상시키는 방법을 요약합니다. 또한 추론 속도를 높이는 것을 가능하게 합니다.