Neues Speicher-Framework baut KI-Agenten, die mit der Unvorhersehbarkeit der realen Welt umgehen kön

Folgen

Neues Speicher-Framework baut KI-Agenten, die mit der Unvorhersehbarkeit der realen Welt umgehen können

ReasoningBank ist ein neues Framework, das Large Language Model (LLM)-Agenten befähigt, durch die Organisation von Erfahrungen in einer Speicherbank zu lernen und sich zu verbessern. Dieses Framework destilliert generalisierbare Denkstrategien aus erfolgreichen und erfolglosen Versuchen, Probleme zu lösen. Der Agent verwendet diesen Speicher während der Inferenz, vermeidet frühere Fehler und trifft bessere Entscheidungen bei neuen Aufgaben. ReasoningBank übertrifft traditionelle Speichermechanismen in Web-Browsing- und Software-Engineering-Benchmarks. Aktuelle LLM-Agenten lernen oft nicht aus gesammelten Erfahrungen, wiederholen Fehler und verpassen wertvolle Erkenntnisse. ReasoningBank begegnet diesem Problem, indem es jede Aufgabenerfahrung in wiederverwendbaren Denk-Speicher umwandelt. Dies ermöglicht es Agenten, bewährte Strategien aus früheren, ähnlichen Fällen anzupassen. Das Framework verwendet ein LLM-as-a-Judge-Schema, um Erfolg und Misserfolg zu beurteilen, wodurch menschliche Kennzeichnung überflüssig wird. Agenten rufen relevante Erinnerungen ab, um Aktionen zu steuern, indem sie den Speicher in ihren Denkprozess integrieren. Memory-aware Test-Time Scaling (MaTTS) verbessert die Leistung durch die Integration von Skalierung mit ReasoningBank. MaTTS integriert parallele und sequentielle Skalierung und steigert die Leistung weiter. ReasoningBank zeigte verbesserte Erfolgsraten und reduzierte Interaktionsschritte bei Web-Browsing-Aufgaben. Es hat einen direkten Einfluss auf die Betriebskosten, insbesondere durch die Eliminierung von Versuch und Irrtum. ReasoningBank bietet einen praktischen Weg zum Aufbau adaptiver und lebenslang lernender Agenten für Unternehmen und Anwendungen.

AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app

New memory framework builds AI agents that can handle the real world's unpredictability venturebeat.com

RSS Hunter • 8. Okt. 2025