RSS惑星Python
フォロー
Python コーディングスタック:2. エージェントの構造
エージェントは、単に賢いモデルそのものではなく、大規模言語モデルを中心に構築されたシステムです。それらは、単一のやり取りを超えて持続し、行動することを可能にする特殊なコンポーネントを備えています。ほとんどのエージェントの基本的な構造には、推論のためのモデル、ガイダンスのための指示、情報の保存のためのメモリ、能力を拡張するためのツール、そして継続的な操作のための実行ループが含まれます。モデル、またはLLMは、言語を処理し、アクションを決定する推論エンジンとして機能します。指示は、エージェントの目的、アイデンティティ、および望ましい行動を定義し、その意思決定に焦点を当てます。各ターンでリセットされるLLMのコンテキストウィンドウとは異なり、エージェントのメモリはセッション間でアクセス可能な、外部の永続的な情報ストアです。このメモリは、時間の経過とともにコンテキストを維持し、運用上の継続性を可能にします。ツールは、エージェントにテキスト生成を超えた機能を提供し、外部世界と対話することを可能にします。実行ループは、観察、意思決定、アクション、評価のエージェントのサイクルを調整します。これらのコアコンポーネントのいずれかが欠けていると、エージェントの動作は著しく変化します。会話内のLLMの明らかなメモリとエージェントの永続的なメモリとの区別は、エージェントの機能性を理解する上で重要です。システム、モデルそのものではなく、LLMのコンテキストウィンドウに情報を管理し、供給します。最終的に、エージェントの効果は、その構成要素すべての相乗的な相互作用に依存します。