Китайский стартап в области искусственного интеллекта DeepSeek ускоряет выпуск своей модели R2 после успеха модели R1, которая превзошла многих американских конкурентов при меньшей стоимости, спровоцировав падение рынка. Модель R2 обещает улучшенные возможности кодирования и рассуждения на нескольких языках, помимо английского. Материнская компания DeepSeek, High-Flyer, инвестировала на раннем этапе в вычислительные мощности, включая два суперкомпьютерных кластера, что дает компании конкурентное преимущество. Второй кластер, Fire-Flyer II, состоит примерно из 10 000 чипов Nvidia A100. Рентабельность DeepSeek обусловлена инновационными архитектурными решениями, такими как Mixture-of-Experts и многоголовое латентное внимание. По данным аналитиков Bernstein, цены компании в 20-40 раз ниже, чем у эквивалентных моделей OpenAI. Конкурентное давление уже вынудило OpenAI снизить цены и выпустить упрощенную модель. Google с Gemini также ввела дисконтированные уровни доступа в ответ на конкурентные цены DeepSeek. Модель R1 от DeepSeek была выпущена в январе, и планировалось, что за ней последует модель R2 в мае, но теперь компания хочет выпустить её как можно раньше. Успех моделей DeepSeek вызвал значительную реакцию рынка, с падением капитализации более чем на 1 триллион долларов.
t.me
Читайте AI и ML Новости в Телеграмм канале @ai_ml_news_ru
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
slashdot.org
DeepSeek Accelerates AI Model Timeline as Market Reacts To Low-Cost Breakthrough
Create attached notes ...
