새로운 메모리 프레임워크, 현실 세계의 예측 불가능성에... 노트
RSS VentureBeat

새로운 메모리 프레임워크, 현실 세계의 예측 불가능성에 대처하는 AI 에이전트 구축

ReasoningBank는 대규모 언어 모델(LLM) 에이전트가 경험을 메모리 뱅크에 정리하여 학습하고 개선할 수 있도록 지원하는 새로운 프레임워크입니다. 이 프레임워크는 문제 해결에 성공하거나 실패한 시도에서 일반화 가능한 추론 전략을 추출합니다. 에이전트는 추론 과정에서 이 메모리를 사용하여 과거의 실수를 피하고 새로운 작업에 대해 더 나은 결정을 내립니다. ReasoningBank는 웹 브라우징 및 소프트웨어 엔지니어링 벤치마크에서 기존의 메모리 메커니즘보다 뛰어난 성능을 보입니다. 현재 LLM 에이전트는 축적된 경험으로부터 학습하지 못하고 실수를 반복하며 귀중한 통찰력을 놓치는 경우가 많습니다. ReasoningBank는 각 작업 경험을 재사용 가능한 추론 메모리로 변환하여 이러한 문제를 해결합니다. 이를 통해 에이전트는 과거의 유사한 사례에서 입증된 전략을 적용할 수 있습니다. 이 프레임워크는 인간의 라벨링 없이 성공과 실패를 판단하기 위해 LLM-as-a-judge 방식을 활용합니다. 에이전트는 메모리를 추론 과정에 통합하여 관련 메모리를 검색하고 작업을 안내합니다. 메모리 인식 테스트 시간 스케일링(MaTTS)은 ReasoningBank와 스케일링을 통합하여 성능을 향상시킵니다. MaTTS는 병렬 및 순차적 스케일링을 통합하여 성능을 더욱 향상시킵니다. ReasoningBank는 웹 브라우징 작업에서 성공률을 향상시키고 상호 작용 단계를 줄이는 것을 보여주었습니다. 특히 시행착오를 제거하여 운영 비용에 직접적인 영향을 미칩니다. ReasoningBank는 기업 및 애플리케이션을 위한 적응형 및 평생 학습 에이전트를 구축하는 실용적인 경로를 제공합니다.
CdXz5zHNQW_AsGWTGL8tp.jpeg