Le nouveau modèle de raisonnem... Note

Le nouveau modèle de raisonnement ouvert TRM d'un chercheur en IA de Samsung surpasse des modèles 10 000 fois plus grands — sur des problèmes spécifiques.

Alexia Jolicoeur-Martineau de Samsung a développé le Tiny Recursion Model (TRM), un petit modèle d'IA open-source. TRM, avec seulement 7 millions de paramètres, rivalise avec des modèles beaucoup plus grands comme o3-mini d'OpenAI et Gemini 2.5 Pro de Google. Le modèle excelle dans les tâches de raisonnement structurées et basées sur une grille, comme le Sudoku et les puzzles. TRM utilise une architecture à deux couches avec un raffinement récursif de ses propres prédictions, remplaçant le besoin de modèles plus grands et plus complexes. Cette approche récursive lui permet d'atteindre des performances élevées sur des benchmarks spécifiques. La disponibilité open-source de TRM sous licence MIT permet une utilisation et une modification généralisées. Le succès de TRM découle du minimalisme, réduisant la complexité pour une meilleure généralisation et évitant le surapprentissage. Le succès du modèle a suscité le débat, certains saluant son efficacité, tandis que d'autres ont remis en question la portée de son applicabilité. De futures recherches pourraient explorer des variantes génératives et des lois d'échelle pour la récursion, en s'appuyant sur le cadre de TRM. TRM prouve qu'une réflexion récursive soigneusement conçue peut être plus efficace que simplement augmenter la taille du modèle.
CdXz5zHNQW_Gh4GwJzeNS.png