DeepSeek, китайский стартап в области искусственного интеллекта, выпустил DeepSeek-V3.2 и DeepSeek-V3.2-Speciale, модели ИИ, претендующие на паритет с GPT-5 от OpenAI и Gemini-3.0-Pro от Google. DeepSeek-V3.2-Speciale добилась результатов, достойных золотой медали, на международных академических соревнованиях, демонстрируя свои элитные способности к рассуждению. Модели используют "DeepSeek Sparse Attention", значительно снижая вычислительные затраты, особенно для длинных входных данных. Стандартная модель V3.2 хорошо справляется с задачами рассуждения и кодирования, превосходя GPT-5 в некоторых тестах. Модели DeepSeek являются открытыми исходниками под лицензией MIT, что отличается от проприетарного подхода американских конкурентов. Модели обучены думать, используя инструменты, что расширяет возможности решения многоэтапных задач. DeepSeek сталкивается с регуляторными проблемами, некоторые европейские и американские власти выражают обеспокоенность по поводу безопасности данных. Компания указывает, что может использовать чипы китайского производства, потенциально обходя экспортный контроль США. Выпуск DeepSeek бросает вызов представлению о том, что лидерство в области ИИ требует огромных затрат. Компания признает ограничения в мировых знаниях, но планирует решить эту проблему. Достижения DeepSeek сигнализируют о новой фазе в гонке ИИ, когда модели с открытым исходным кодом бросают вызов американскому доминированию.
venturebeat.com
DeepSeek just dropped two insanely powerful AI models that rival GPT-5 and they're totally free
t.me
AI и ML Дайджест в Телеграмм канале @ai_ml_news_ru
