トレーニング時間比較：マルチトークン対ネクストトークン予測

この表 (S5) は、マルチトークン予測のトレーニング時間のオーバーヘッドを、次のトークン予測と比較して定量化しており、さまざまなLLMサイズにおけるその計算効率を示しています。