중국 AI 스타트업 DeepSeek가 OpenAI의 GPT-5 및 Google의 Gemini-3.0-Pro와 동등한 수준이라고 주장하는 AI 모델 DeepSeek-V3.2 및 DeepSeek-V3.2-Speciale을 출시했습니다. DeepSeek-V3.2-Speciale은 국제 학술 대회에서 금메달을 획득하며 뛰어난 추론 능력을 입증했습니다. 이 모델들은 "DeepSeek 희소 어텐션"을 사용하여 특히 긴 입력에 대한 계산 비용을 크게 줄입니다. 표준 V3.2 모델은 추론 및 코딩 작업에서 좋은 성능을 보이며, 일부 벤치마크에서 GPT-5를 능가합니다. DeepSeek의 모델들은 미국 경쟁사들의 독점적인 접근 방식과 달리 MIT 라이선스 하에 오픈 소스로 제공됩니다. 이 모델들은 도구를 사용하면서 생각하도록 훈련되어 다단계 문제 해결 능력을 향상시켰습니다. DeepSeek는 일부 유럽 및 미국 당국이 데이터 보안 문제를 제기하면서 규제적 어려움에 직면해 있습니다. 회사는 중국산 칩을 활용하여 미국의 수출 통제를 우회할 수 있다고 밝혔습니다. DeepSeek의 출시는 AI 리더십에 막대한 지출이 필요하다는 생각을 뒤흔들고 있습니다. 회사는 세계 지식에 대한 한계를 인정하지만 이를 해결할 계획입니다. DeepSeek의 발전은 오픈 소스 모델이 미국의 지배력에 도전하면서 AI 경쟁의 새로운 국면을 알리고 있습니다.
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
venturebeat.com
DeepSeek just dropped two insanely powerful AI models that rival GPT-5 and they're totally free
