RSS DEV 커뮤니티

RAG는 메모리가 아닙니다. 임베딩이 있는 Ctrl+F입니다.

Follow
이 글은 AI 에이전트에서 "메모리"로 흔히 사용되는 검색 증강 생성(Retrieval-Augmented Generation, RAG)을 비판합니다. 저자는 벡터 검색에 기반한 RAG는 근본적으로 검색일 뿐 진정한 메모리가 아니며, 이로 인해 에이전트가 오래되거나 관련 없는 정보를 검색하는 등의 문제가 발생한다고 주장합니다. 맥락 인식이 부족한 청크, 코사인 유사성 이상의 구조 부재, 시간이라는 개념이 최우선으로 고려되지 않는다는 세 가지 치명적인 결함을 지적합니다. 저자는 현재의 "메모리 프레임워크"가 공식적인 "모르겠다" 메커니즘과 같은 핵심 속성이 부족하기 때문에 불충분하다고 일축합니다. 또한, 비용, 검색 문제, 지속성 부족을 지적하며 극도로 긴 맥락에 의존하는 추세를 비판합니다. 저자는 "메모리"라는 단어를 "검색"으로 대체하고, 시간적 검증을 활용하며, "모르겠다"를 가능한 결과로 만들 것을 옹호합니다. 이 글은 진정한 메모리가 가능하며, 2부에서는 7가지 아키텍처 원칙을 자세히 다룰 것임을 암시하며 마무리됩니다.
favicon
dev.to
RAG isn't memory. It's Ctrl+F with embeddings.
기사 이미지: RAG는 메모리가 아닙니다. 임베딩이 있는 Ctrl+F입니다.