Сообщество RSS DEV

RAG — это не память. Это Ctrl+F с вложениями.

Follow
Эта статья критикует распространенное использование Retrieval-Augmented Generation (RAG) в качестве "памяти" в AI-агентах. Автор утверждает, что RAG, основанный на векторном поиске, по сути, является просто поиском, а не истинной памятью, что приводит к таким проблемам, как извлечение устаревшей или нерелевантной информации агентами. Выделены три критических недостатка: отсутствие контекстной осведомленности у фрагментов, отсутствие структуры, кроме косинусной близости, и отсутствие времени как первостепенной концепции. Автор отвергает текущие "фреймворки памяти" как недостаточные, поскольку им не хватает основных свойств, таких как формальный механизм "Я не знаю". В статье также оспаривается тенденция полагаться на чрезвычайно длинные контексты, указывая на стоимость, проблемы с отзывом и отсутствие постоянства. Автор выступает за замену слова "память" на "извлечение", использование временной валидации и превращение "Я не знаю" в возможный результат. Статья завершается подчеркиванием того, что истинная память возможна, и намеком на часть 2, в которой будут рассмотрены семь архитектурных принципов.
favicon
dev.to
RAG isn't memory. It's Ctrl+F with embeddings.
Изображение к статье: RAG — это не память. Это Ctrl+F с вложениями.
Create attached notes ...