RSS VentureBeat
フォロー
新しいメモリフレームワークが、現実世界の予測不可能性に対応できるAIエージェントを構築
ReasoningBankは、LLMエージェントが経験をメモリバンクに整理することで学習・改善できるようにする新しいフレームワークです。このフレームワークは、問題解決の成功・失敗の両方の試みから一般化可能な推論戦略を抽出します。エージェントは推論中にこのメモリを使用し、過去の過ちを避け、新しいタスクでより良い意思決定を行います。ReasoningBankは、Webブラウジングとソフトウェアエンジニアリングのベンチマークにおいて、従来のメモリメカニズムを上回る性能を発揮します。現在のLLMエージェントは、蓄積された経験から学習できず、過ちを繰り返し、貴重な洞察を見逃すことがよくあります。ReasoningBankは、各タスク経験を再利用可能な推論メモリに変換することで、この問題に対処します。これにより、エージェントは過去の類似ケースから証明された戦略を適応させることができます。このフレームワークは、LLM-as-a-judgeスキームを使用して成功と失敗を判断し、人間のラベリングの必要性を排除します。エージェントは、メモリを推論プロセスに組み込むことで、関連するメモリを取得して行動をガイドします。Memory-aware Test-Time Scaling (MaTTS)は、ReasoningBankとのスケーリングを統合することでパフォーマンスを向上させます。MaTTSは、並列および逐次スケーリングを組み込み、パフォーマンスをさらに向上させます。ReasoningBankは、Webブラウジングタスクにおいて、成功率の向上とインタラクションステップの削減を示しました。これは、特に試行錯誤の排除において、運用コストに直接的な影響を与えます。ReasoningBankは、企業やアプリケーション向けの適応性のある生涯学習エージェントを構築するための実用的な道を提供します。