Strategisches Training von LLMs: Dateneffizienz der Multi-Token-Vorhersage beim mathematischen Denken

Diese Abbildung veranschaulicht den tiefgreifenden Einfluss der Trainingsgröße auf die Leistung von Modellen für die Mehr-Token-Vorhersage auf GSM8K und hebt kritische Überlegungen zur Dateneffizienz für mathematisches Schlussfolgern hervor.