RSS VentureBeat
팔로우
새로운 메모리 프레임워크, 현실 세계의 예측 불가능성에 대처하는 AI 에이전트 구축
ReasoningBank는 대규모 언어 모델(LLM) 에이전트가 경험을 메모리 뱅크에 정리하여 학습하고 개선할 수 있도록 지원하는 새로운 프레임워크입니다. 이 프레임워크는 문제 해결에 성공하거나 실패한 시도에서 일반화 가능한 추론 전략을 추출합니다. 에이전트는 추론 과정에서 이 메모리를 사용하여 과거의 실수를 피하고 새로운 작업에 대해 더 나은 결정을 내립니다. ReasoningBank는 웹 브라우징 및 소프트웨어 엔지니어링 벤치마크에서 기존의 메모리 메커니즘보다 뛰어난 성능을 보입니다. 현재 LLM 에이전트는 축적된 경험으로부터 학습하지 못하고 실수를 반복하며 귀중한 통찰력을 놓치는 경우가 많습니다. ReasoningBank는 각 작업 경험을 재사용 가능한 추론 메모리로 변환하여 이러한 문제를 해결합니다. 이를 통해 에이전트는 과거의 유사한 사례에서 입증된 전략을 적용할 수 있습니다. 이 프레임워크는 인간의 라벨링 없이 성공과 실패를 판단하기 위해 LLM-as-a-judge 방식을 활용합니다. 에이전트는 메모리를 추론 과정에 통합하여 관련 메모리를 검색하고 작업을 안내합니다. 메모리 인식 테스트 시간 스케일링(MaTTS)은 ReasoningBank와 스케일링을 통합하여 성능을 향상시킵니다. MaTTS는 병렬 및 순차적 스케일링을 통합하여 성능을 더욱 향상시킵니다. ReasoningBank는 웹 브라우징 작업에서 성공률을 향상시키고 상호 작용 단계를 줄이는 것을 보여주었습니다. 특히 시행착오를 제거하여 운영 비용에 직접적인 영향을 미칩니다. ReasoningBank는 기업 및 애플리케이션을 위한 적응형 및 평생 학습 에이전트를 구축하는 실용적인 경로를 제공합니다.