Kimi K2.7-Code, 사고 토큰 30% 절감 — 하지만 실무자들은 벤치마크가 맞지 않는다고 말합니다

팔로우

Kimi K2.7-Code, 사고 토큰 30% 절감 — 하지만 실무자들은 벤치마크가 맞지 않는다고 말합니다

Moonshot AI가 코딩 모델 K2의 오픈소스 업데이트 버전인 Kimi K2.7-Code를 출시했습니다. 이 새로운 버전은 1조 개의 매개변수를 가진 mixture-of-experts 아키텍처를 기반으로 구축되었으며, 쉬운 통합을 위한 OpenAI 호환 API를 제공합니다. Moonshot AI는 K2.7-Code가 더 간결한 추론과 향상된 성능을 보여주며, 사고 토큰 사용량이 크게 감소했다고 주장합니다. 이러한 효율성 증가는 에이전트 워크플로우를 사용하는 팀의 추론 비용을 낮출 것으로 예상됩니다. 이 모델은 기존 라이브러리를 감싸는 대신 직접 구현을 작성하여 프로그래밍 언어 및 작업 유형 전반에 걸쳐 더 나은 일반화를 목표로 합니다. Moonshot AI는 Kimi Code Bench v2 및 Program Bench와 같은 자체 벤치마크에서 상당한 성능 향상을 보고했습니다. 그러나 독립적인 평가는 그 능력에 대해 더 미묘한 그림을 제시합니다. 한 연구원은 K2.7-Code가 코드 생성에서 더 "정직"하지만 반드시 더 능숙한 것은 아니며, 일부 생성된 코드가 실패했다고 밝혔습니다. Moonshot AI가 성능 주장에 독점 벤치마크를 사용하는 것에 대한 우려도 제기되었습니다. 이러한 의문에도 불구하고 K2.7-Code가 제공하는 토큰 효율성 향상은 K2.6을 실행하는 기업에 즉시 적용 가능합니다. 팀은 변경 사항을 적용하기 전에 자체 워크로드에서 K2.7-Code를 테스트하여 실제 성능 향상을 평가할 수 있습니다.

Kimi K2.7-Code cuts thinking tokens 30% — but practitioners say the benchmarks don't check out venturebeat.com

RSS Hunter • 6월 12일