このテキストは、LLM(大規模言語モデル)を活用したアプリケーションにおける認知アーキテクチャのパターンを探求しており、特にRetrieval Augmented Generation(RAG、検索拡張生成)システムに焦点を当てています。これらのアーキテクチャを、自律性に基づいて6つのレベルに分類しています。レベル1はLLMを使用しない従来のハードコードされたコードを指し、その後のレベルでは、翻訳、複数のLLM呼び出しの連鎖、ルーティング決定など、LLMが段階的に統合されていきます。ステートマシンは、適応的な改善のためのサイクルを導入します。自律エージェントは、ツールを選択し、指示を独立して改善することができます。RAGは、事実に基づいた根拠とリアルタイムデータへのアクセスを提供することで、LLMの限界に対するソリューションとして提示されています。テキストでは、さまざまなRAG技術を自律性レベルに基づいてランク付けし、実際のアプリケーションを例示しています。RAGのレベルは、古典的な検索から、連鎖型、ルーターベース、ステートマシン駆動型、そして完全自律型のアプローチまで多岐にわたります。記事は最終的に、特定のアプリケーションの要件と複雑さに応じて、適切な自律性レベルを選択することを推奨しています。
dev.to
The RAG Autonomy Spectrum: A Guide to Designing Smarter AI Systems
Create attached notes ...
