RSS VentureBeat
Подписаться
Новая открытая модель рассуждений TRM исследователя Samsung AI превосходит модели, в 10 000 раз большие — на конкретных задачах.
Алексия Жоликер-Мартино из Samsung разработала Tiny Recursion Model (TRM), небольшую модель ИИ с открытым исходным кодом. TRM, имеющая всего 7 миллионов параметров, конкурирует с гораздо более крупными моделями, такими как o3-mini от OpenAI и Gemini 2.5 Pro от Google. Модель превосходно справляется со структурированными задачами, основанными на сетке, такими как судоку и головоломки. TRM использует двухуровневую архитектуру с рекурсивным уточнением собственных предсказаний, заменяя необходимость в более крупных и сложных моделях. Этот рекурсивный подход позволяет ей достигать высокой производительности в определенных тестах. Открытый исходный код TRM под лицензией MIT обеспечивает широкое использование и модификацию. Успех TRM обусловлен минимализмом, снижающим сложность для лучшей обобщаемости и избежания переобучения. Успех модели вызвал дебаты: одни хвалили ее эффективность, другие сомневались в области ее применения. Будущие исследования могут изучить генеративные варианты и законы масштабирования для рекурсии, опираясь на структуру TRM. TRM доказывает, что тщательно продуманное, рекурсивное мышление может быть более эффективным, чем просто увеличение размера модели.