Kimi K2.7-Codeは思考トークンを30%削減するが、実務家はベンチマークが確認できないと述べている

フォロー

Kimi K2.7-Codeは思考トークンを30%削減するが、実務家はベンチマークが確認できないと述べている

Moonshot AIは、K2コーディングモデルのオープンソースアップデートであるKimi K2.7-Codeをリリースしました。この新バージョンは、1兆パラメータの混合エキスパートアーキテクチャに基づいて構築されており、簡単な統合のためのOpenAI互換APIを提供します。Moonshot AIは、K2.7-Codeがより効率的な推論とパフォーマンスの向上を示し、思考トークン使用量を大幅に削減していると主張しています。この効率の向上は、エージェントワークフローを使用するチームの推論コストを削減すると期待されています。このモデルは、既存のライブラリをラップするのではなく、直接実装を作成し、プログラミング言語やタスクタイプ全体でのより良い汎化を目指しています。Moonshot AIは、Kimi Code Bench v2やProgram Benchなどの独自のベンチマークで大幅な向上を報告しています。しかし、独立した評価では、その機能に関するよりニュアンスのある状況が示唆されています。ある研究者は、K2.7-Codeがコード生成においてより「正直」であると発見しましたが、必ずしもより有能ではなく、生成されたコードの一部が失敗しました。Moonshot AIがパフォーマンスの主張に独自のベンチマークを使用していることについても懸念が提起されています。これらの疑問にもかかわらず、K2.7-Codeが提供するトークン効率の向上は、K2.6を実行している企業にすぐに適用可能です。チームは、変更を加える前に、独自のワークロードでK2.7-Codeをテストして、実際のパフォーマンスの向上を評価できます。

Kimi K2.7-Code cuts thinking tokens 30% — but practitioners say the benchmarks don't check out venturebeat.com

RSS Hunter • 6月12日