RSS VentureBeat

Маленькая, открытая модель Qwen3.5-9B от Alibaba превосходит gpt-oss-120B от OpenAI и может работать на стандартных ноутбуках.

Команда Qwen компании Alibaba выпустила серию малых моделей Qwen3.5, ориентированную на эффективность и универсальность, с моделями от 0,8 до 9 миллиардов параметров. Эти модели используют гибридную архитектуру для более быстрого вывода и меньшей задержки, решая проблемы с ограничениями памяти. Серия является изначально мультимодальной, обеспечивая превосходное визуальное понимание по сравнению с предыдущими поколениями. Тесты показывают, что модель 9B превосходит более крупные модели в нескольких категориях, включая рассуждение и многоязычные задачи. Модели доступны во всем мире по лицензии Apache 2.0, что позволяет свободно использовать их в коммерческих целях и настраивать. Разработчики в восторге от возможности запускать эти модели локально, повышая доступность и снижая затраты. Серия разработана для "агентных" приложений, позволяющих автоматизировать различные задачи. Эти компактные модели особенно подходят для корпоративных функций, таких как разработка программного обеспечения и анализ данных. Потенциальные недостатки включают риск каскадирования ошибок, проблемы с отладкой и проблемы с размещением данных. Выпуск демократизирует искусственный интеллект, предоставляя мощные возможности на периферийных устройствах и локальных серверах.
favicon
t.me
AI и ML Дайджест в Телеграмм канале @ai_ml_news_ru
favicon
venturebeat.com
Alibaba's small, open source Qwen3.5-9B beats OpenAI's gpt-oss-120B and can run on standard laptops
Create attached notes ...