Un nouveau cadre de mémoire pe... Note

Un nouveau cadre de mémoire permet de créer des agents d'IA capables de gérer l'imprévisibilité du monde réel

ReasoningBank est un nouveau cadre qui permet aux agents de modèles linguistiques volumineux (LLM) d'apprendre et de s'améliorer en organisant les expériences dans une banque de mémoire. Ce cadre extrait des stratégies de raisonnement généralisables à partir des tentatives réussies et infructueuses de résolution de problèmes. L'agent utilise cette mémoire lors de l'inférence, évitant les erreurs passées et prenant de meilleures décisions sur de nouvelles tâches. ReasoningBank surpasse les mécanismes de mémoire traditionnels sur les benchmarks de navigation web et d'ingénierie logicielle. Les agents LLM actuels échouent souvent à apprendre des expériences accumulées, répétant les erreurs et manquant des informations précieuses. ReasoningBank y remédie en transformant chaque expérience de tâche en une mémoire de raisonnement réutilisable. Cela permet aux agents d'adapter des stratégies éprouvées à partir de cas similaires passés. Le cadre utilise un schéma LLM-as-a-judge pour juger du succès et de l'échec, éliminant ainsi le besoin d'étiquetage humain. Les agents récupèrent les mémoires pertinentes pour guider les actions en intégrant la mémoire dans leur processus de raisonnement. Memory-aware Test-Time Scaling (MaTTS) améliore les performances en intégrant la mise à l'échelle avec ReasoningBank. MaTTS intègre une mise à l'échelle parallèle et séquentielle, améliorant encore les performances. ReasoningBank a montré des taux de réussite améliorés et une réduction des étapes d'interaction dans les tâches de navigation web. Il a un impact direct sur les coûts opérationnels, en particulier en éliminant les essais et erreurs. ReasoningBank offre une voie pratique vers la construction d'agents adaptatifs et d'apprentissage tout au long de la vie pour les entreprises et les applications.
CdXz5zHNQW_AsGWTGL8tp.jpeg