戦略的LLMトレーニング：数学的推論におけるマルチトークン予測のデータ効率

この図は、GSM8Kにおけるマルチトークン予測モデルのパフォーマンスに対するトレーニング規模の深遠な影響を示しており、数学的推論における重要なデータ効率の考慮事項を浮き彫りにしています。