私たちは、大型モデルのコードタスクにおいて分布の不一致を低減し、高速な推論を可能にすることで、多トークン予測がLLMのパフォーマンスを向上させることをまとめている。
hackernoon.com
Multi-Token Prediction: Bridging Training-Inference Mismatch in LLMs
bsky.app
Hacker & Security News on Bluesky @hacker.at.thenote.app
