DeepSeek ускоряет разработку моделей ИИ благодаря прорыву, позволившему снизить затраты, что вызвало бурную реакцию на рынке.

Китайский стартап в области искусственного интеллекта DeepSeek ускоряет выпуск своей модели R2 после успеха модели R1, которая превзошла многих американских конкурентов при меньшей стоимости, спровоцировав падение рынка. Модель R2 обещает улучшенные возможности кодирования и рассуждения на нескольких языках, помимо английского. Материнская компания DeepSeek, High-Flyer, инвестировала на раннем этапе в вычислительные мощности, включая два суперкомпьютерных кластера, что дает компании конкурентное преимущество. Второй кластер, Fire-Flyer II, состоит примерно из 10 000 чипов Nvidia A100. Рентабельность DeepSeek обусловлена инновационными архитектурными решениями, такими как Mixture-of-Experts и многоголовое латентное внимание. По данным аналитиков Bernstein, цены компании в 20-40 раз ниже, чем у эквивалентных моделей OpenAI. Конкурентное давление уже вынудило OpenAI снизить цены и выпустить упрощенную модель. Google с Gemini также ввела дисконтированные уровни доступа в ответ на конкурентные цены DeepSeek. Модель R1 от DeepSeek была выпущена в январе, и планировалось, что за ней последует модель R2 в мае, но теперь компания хочет выпустить её как можно раньше. Успех моделей DeepSeek вызвал значительную реакцию рынка, с падением капитализации более чем на 1 триллион долларов.

t.me

Читайте AI и ML Новости в Телеграмм канале @ai_ml_news_ru

bsky.app

AI and ML News on Bluesky @ai-news.at.thenote.app

slashdot.org

DeepSeek Accelerates AI Model Timeline as Market Reacts To Low-Cost Breakthrough

RSS Hunter

2025-02-25

Create attached notes ...