중국 AI 스타트업 딥시크(DeepSeek)는 R1 모델의 성공에 힘입어 R2 모델 출시를 앞당기고 있습니다. R1 모델은 많은 미국 경쟁사들을 저렴한 비용으로 능가하며 시장 매도를 유발했습니다. R2 모델은 영어를 넘어 여러 언어에서 향상된 코딩 능력과 추론 능력을 제공할 것으로 기대됩니다. 딥시크의 모회사인 하이플라이어(High-Flyer)는 두 개의 슈퍼컴퓨팅 클러스터를 포함한 컴퓨팅 파워에 일찍 투자하여 경쟁 우위를 확보했습니다. 두 번째 클러스터인 파이어플라이어 II(Fire-Flyer II)는 약 1만 개의 엔비디아 A100 칩으로 구성되어 있습니다. 딥시크의 비용 효율성은 전문가 혼합(Mixture-of-Experts) 및 다중 헤드 잠재적 주의(multihead latent attention)와 같은 혁신적인 아키텍처 선택에서 비롯됩니다. 번스타인 애널리스트에 따르면, 딥시크의 가격은 OpenAI의 동급 모델보다 20~40배 저렴합니다. 이러한 경쟁 압력은 OpenAI로 하여금 이미 가격 인하와 축소된 모델 출시를 강제했습니다. 구글의 Gemini 또한 딥시크의 경쟁적인 가격 책정에 대응하여 할인된 접근 수준을 도입했습니다. 1월에 출시된 딥시크의 R1 모델은 5월에 R2 모델이 출시될 예정이었지만, 현재 회사는 가능한 한 빨리 출시하기를 원하고 있습니다. 딥시크 모델의 성공은 1조 달러가 넘는 시장 매도를 야기하는 등 시장에 상당한 반응을 불러일으켰습니다.
slashdot.org
DeepSeek Accelerates AI Model Timeline as Market Reacts To Low-Cost Breakthrough
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
Create attached notes ...
