RSS Microsoft Teams Blog 記事

マルチモーダルデータアクセスによるエージェント型関数呼び出しの理解

このガイドでは、LLM(大規模言語モデル)の関数呼び出しを利用して、複数のソースからのデータにアクセスし、組み合わせることで、エージェントシステムを構築する方法を説明します。関数呼び出しにより、LLMはテキストのみの回答を提供する代わりに、SQLクエリやファイルリーダーなどのツールを使用できるようになります。エージェントシステムは、自律性、ツール利用、反復的な推論を特徴とし、多段階の問題解決を可能にします。反復的なツール利用ループは、エージェントがツールを呼び出し、結果を分析し、必要に応じて繰り返すことで、この推論を促進します。マルチモーダルデータアクセスは、SQLデータベースやブロブストレージなど、さまざまなデータストアの強みを組み合わせます。BlobPath列を使用したクロスリファレンスパターンは、重要なアーキテクチャ要素です。スキーマの注入や方言ルールを含む効果的なシステムプロンプトは、エージェントの動作に不可欠です。ツール設計は、単一の責任、豊富な説明、構造化されたデータのリターン、優雅なエラー処理、および限定されたスコープに焦点を当てることが重要です。LLMの意思決定プロセスは、ツールの説明、システムプロンプト、結果、および会話履歴を考慮します。エージェントは、過去のターンをその後のインタラクションに組み込むことで、会話のメモリを通じてコンテキストを維持します。
favicon
techcommunity.microsoft.com
Understanding Agentic Function-Calling with Multi-Modal Data Access