中国のAIスタートアップ、DeepSeekは、米国企業を上回る低コストで高いパフォーマンスを示したR1モデルが成功したため、R2モデルのリリースを早めることを計画している。R2モデルは、英語以外の複数の言語でのコーディング能力と推論能力の向上を約束している。DeepSeekの親会社であるHigh-Flyerは、早期に計算能力に投資し、2つのスーパーコンピューティングクラスターを所有している。これにより、同社は競争上の優位性を得ている。2番目のクラスターであるFire-Flyer IIは、約10,000個のNvidia A100チップで構成されている。DeepSeekのコスト効率は、Mixture-of-Expertsやマルチヘッド潜在的注意などの革新的なアーキテクチャ選択によるものである。同社の価格設定は、OpenAIの同等モデルよりも20-40倍安いとされる。競争圧力はすでにOpenAIに価格を下げさせ、縮小版モデルをリリースさせるなど、影響を与えている。GoogleのGeminiも、DeepSeekの競争価格に応じて割引アクセス階層を導入している。DeepSeekのR1モデルは1月にリリースされ、5月にR2モデルをリリースする予定だったが、同社は早期にR2モデルをリリースしたいと考えている。DeepSeekのモデルの成功は、市場に大きな影響を与え、1兆ドル以上の市場売却を引き起こしている。
slashdot.org
DeepSeek Accelerates AI Model Timeline as Market Reacts To Low-Cost Breakthrough
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
Create attached notes ...
