ADR: 프로덕션 환경에서 Amazon Bedrock ... 노트

ADR: 프로덕션 환경에서 Amazon Bedrock AgentCore 채택

AWS 금융 플랫폼 아키텍트인 저자는 규제된 금융 환경에서 AI 에이전트를 운영하기 위해 Amazon Bedrock AgentCore를 채택한 배경의 의사 결정 과정을 상세히 설명합니다. 기존 접근 방식은 2 AM 장애 및 규정 준수와 같은 중요한 운영 문제에 어려움을 겪었습니다. 긴급한 해결책이 필요했던 다섯 가지 주요 요인은 다음과 같습니다. 크로스턴 상태 관리, 규정 준수 추적성 보장, 강력한 가드레일 구현, 예측 불가능한 토큰 비용 제어, 런타임 이식성 달성입니다. EKS에서의 자체 호스팅 솔루션, 이전 세대의 Bedrock Agents, Lambda와 함께 Step Functions 사용을 포함한 여러 옵션이 고려되었습니다. EKS에서의 자체 호스팅 옵션은 높은 운영 책임과 엔지니어링 비용으로 인해 기각되었습니다. 이전 Bedrock Agents 세대는 제한된 가시성 및 예산 제어로 인해 불충분하다고 판단되었습니다. Step Functions는 결정론적 워크플로우에서의 강점에도 불구하고 대화형 에이전트 런타임으로는 부적절하다고 판단되었습니다. Amazon Bedrock AgentCore는 세션 메모리, 가드레일, 추적성 및 도구 사용을 위한 네이티브 기능을 갖춘 관리형 런타임을 제공하는 권장 솔루션으로 부상했습니다. AgentCore를 선택한 결정적인 요인은 도구별 OAuth2/OIDC 지원을 갖춘 게이트웨이와 금융 분야의 보안 및 규정 준수에 중요한 구성 가능한 TTL을 갖춘 관리형 세션 메모리였습니다. 저자는 런타임에 대한 플랫폼 종속성의 절충점을 인정하지만, 기본 도구의 이식성을 강조합니다. 이 글은 효과적이고 안전한 운영을 위해 가드레일, AgentCore 메모리, 게이트웨이 및 토큰 예산에 대한 구체적인 구성 조언을 제공하며, 이들의 중요성을 강조합니다. TurnsPerSession, TokensPerSession, ToolCallFailureRate, GuardrailInterventionRate와 같은 가시성 지표가 설명되어 있으며, 상세한 추적 및 규제 감사를 위해 X-Ray 및 CloudTrail을 활용하는 것이 강조됩니다. 저자는 또한 런타임 종속성, 보수적인 할당량, 가드레일 지연 시간 및 메모리 비용을 포함한 결과 및 위험에 대해 경고하며, 신중한 수용 및 완화 전략을 촉구합니다.