이 포스트에서는 Amazon SageMaker의 새로운 스티키 라우팅 기능을 통해 다중 모드 모델을 제공할 때 최적의 초저 지연 시간을 달성하고 최종 사용자 경험을 향상시킬 수 있는 방법을 설명했습니다.
aws.amazon.com
Build ultra-low latency multimodal generative AI applications using sticky session routing in Amazon SageMaker