Empirische Validierung der Vorhersage mehrerer Token für LLMs

Untersuchen Sie umfangreiche, groß angelegte Experimente, die die Wirksamkeit der Multi-Token-Vorhersage zur Verbesserung der Leistung von LLMs über verschiedene Modellgrößen, Inferenzgeschwindigkeiten und bei verschiedenen Sprachaufgaben hinweg demonstrieren.