この記事は、AIエージェントにおける「メモリ」としてのRetrieval-Augmented Generation(RAG)の一般的な使用法を批判しています。著者は、ベクトル検索に基づいたRAGは根本的に検索に過ぎず、真のメモリではないと主張しており、エージェントが時代遅れまたは無関係な情報を取得するなどの問題につながっています。3つの重大な欠陥が特定されています。チャンクの文脈認識の欠如、コサイン類似性以外の構造の不在、そして時間を第一級の概念として扱っていないことです。著者は、正式な「わからない」メカニズムのようなコアプロパティを欠いているため、現在の「メモリフレームワーク」は不十分であると却下しています。この記事はまた、コスト、想起の問題、永続性の欠如を指摘し、非常に長いコンテキストに依存する傾向に異議を唱えています。著者は、「メモリ」という言葉を「検索」に置き換えること、時間的検証を利用すること、「わからない」を可能な結果にすることを提唱しています。この記事は、真のメモリは可能であると強調し、パート2で7つのアーキテクチャ原則を掘り下げることを示唆して締めくくられています。
dev.to
RAG isn't memory. It's Ctrl+F with embeddings.
