В тексте исследуются шаблоны когнитивной архитектуры для приложений на базе LLM, уделяя особое внимание системам дополненной генерации (RAG). Он классифицирует эти архитектуры на шесть уровней в зависимости от автономности, от жестко запрограммированных шагов до полностью автономных агентов. Классический код без LLM считается первым уровнем. На последующих уровнях LLM постепенно интегрируются для таких задач, как перевод, объединение в цепочку нескольких вызовов LLM и принятие решений по маршрутизации. Конечные автоматы вводят циклы для адаптивного уточнения. Автономные агенты могут самостоятельно выбирать инструменты и уточнять инструкции. RAG представлена как решение для ограничения LLM, предлагающее фактическое обоснование и доступ к данным в режиме реального времени. В тексте также ранжируются различные методы RAG на основе уровней автономности, иллюстрируя их применение в реальном мире. Уровни RAG варьируются от классического поиска до цепных, основанных на маршрутизаторах, управляемых конечными автоматами и полностью автономных подходах. В конечном итоге в статье рекомендуется выбрать подходящий уровень автономии в зависимости от требований и сложности конкретного приложения.
dev.to
The RAG Autonomy Spectrum: A Guide to Designing Smarter AI Systems
Create attached notes ...
