RSS DEV 커뮤니티
팔로우
AI 에이전트를 위한 실제로 잊어버리는 메모리 시스템을 구축했습니다
기존 AI 에이전트 메모리 시스템은 영구적인 축적으로 인해 시간이 지남에 따라 오래된 사실들이 검색을 오염시켜 성능과 정확도가 저하되는 문제를 겪고 있습니다. 이 문제는 더 많은 토큰이 직접적으로 더 나쁜 결과와 느리고 멍청한 에이전트와 상관관계가 있기 때문에 발생합니다. 이를 해결하기 위해 능동적으로 망각하는 메모리 시스템인 recall-sqlite가 개발되었습니다. 핵심 원리는 계층적 저장으로, 메모리는 액세스 빈도에 따라 자동으로 계층 간에 이동됩니다. 핫 계층은 자주 액세스되는 메모리를 보유하며, 빠른 검색을 위해 ANN과 키워드를 활용합니다. 웜 계층은 덜 액세스되는 메모리를 저장하며, 키워드와 FTS5에만 의존하여 컴퓨팅을 크게 줄입니다. 콜드 계층은 컴퓨팅 없이 무제한의 메모리를 저장할 수 있으며, 필요할 때 자동으로 승격됩니다. 주요 설계 선택에는 쿼리 시 LLM 사용을 피하고 소규모 로컬 임베딩 모델에만 의존하는 것이 포함됩니다. 전통적인 벡터 데이터베이스를 피하고 sqlite-vec을 사용하여 SQLite를 활용합니다. 이 시스템은 오프라인 시 키워드 및 FTS5 검색으로 대체되는 우아한 성능 저하를 지원합니다. 자동 스키마 마이그레이션은 업데이트를 단순화하며, API 키나 Docker 없이 단일 pip install을 제공합니다. 거의 1500개의 메모리로 매일 6개월간 사용한 후에도 지연 시간은 약 80ms를 유지하며 메모리 사용량은 약 1.5MB로 고정됩니다. recall-sqlite는 이제 Hermes Agent 생태계에 통합되었습니다.