ADR: 本番環境でのAmazon Bedrock Agen... ノート

ADR: 本番環境でのAmazon Bedrock AgentCoreの採用

著者は、AWSの金融プラットフォームアーキテクトであり、規制された金融環境でAIエージェントを運用するためにAmazon Bedrock AgentCoreを採用する際の意思決定プロセスを詳述しています。従来の方式では、午前2時の障害や規制遵守といった重要な運用上の懸念に対処するのが困難でした。5つの主要な要因が緊急の解決策を必要としました。クロス・ターンの状態管理、規制上のトレーサビリティの確保、堅牢なガードレールの実装、予測不能なトークンコストの管理、そしてランタイムのポータビリティの達成です。EKS上でのセルフホストソリューション、Bedrock Agentsの以前の世代、そしてStep FunctionsとLambdaの使用を含む、いくつかの選択肢が検討されました。 EKS上でのセルフホストオプションは、高い運用責任とエンジニアリングコストのため却下されました。Bedrock Agentsの以前の世代は、限定的なオブザーバビリティと予算管理のため不十分と判断されました。Step Functionsは、決定的なワークフローにおける強みにもかかわらず、会話型エージェントのランタイムとしては不適切と見なされました。Amazon Bedrock AgentCoreは、セッションメモリ、ガードレール、トレーサビリティ、ツール使用のためのネイティブ機能を備えたマネージドランタイムを提供し、推奨されるソリューションとして登場しました。 AgentCoreを選択する決定的な要因は、ツールごとのOAuth2/OIDCサポートを備えたGatewayと、金融におけるセキュリティとコンプライアンスに不可欠な設定可能なTTLを持つマネージドセッションメモリでした。著者は、ランタイムにおけるプラットフォームロックインのトレードオフを認めつつも、基盤となるツールのポータビリティを強調しています。この記事では、効果的かつ安全な運用にとっての重要性を強調しながら、ガードレール、AgentCoreメモリ、Gateway、およびトークン予算に関する具体的な設定上のアドバイスを提供しています。TurnsPerSession、TokensPerSession、ToolCallFailureRate、GuardrailInterventionRateなどのオブザーバビリティメトリクスが概説されており、詳細なトレーシングと規制監査のためにX-RayとCloudTrailを活用することも示されています。著者はまた、ランタイムロックイン、保守的なクォータ、ガードレールのレイテンシ、メモリコストを含む結果とリスクについて警告し、慎重な受け入れと緩和戦略を求めています。