RSS DEV 社区

RAG不是记忆。就是Ctrl+F加嵌入。

Follow
本文批判了将检索增强生成(RAG)作为 AI 代理“记忆”的常见做法。作者认为,基于向量搜索的 RAG 本质上只是搜索,而非真正的记忆,由此导致代理检索过时或不相关信息等问题。文章指出了三个关键缺陷:代码块缺乏上下文感知能力、除余弦相似度外缺乏结构化组织、以及时间未被作为一等公民概念纳入。作者驳斥了当前的“记忆框架”不足为据,因其缺乏诸如正式的“我不知道”机制等核心属性。文章还挑战了过度依赖超长上下文的趋势,指出其存在成本高昂、召回率低以及缺乏持久性等问题。作者主张将“记忆”一词替换为“检索”,引入时间验证机制,并将“我不知道”设为可能的输出结果。文章最后强调真正的记忆是可行的,并暗示第二部分将深入探讨七项架构原则。
favicon
dev.to
RAG isn't memory. It's Ctrl+F with embeddings.
文章配图: RAG不是记忆。就是Ctrl+F加嵌入。
Create attached notes ...