RSS AWS 머신 러닝 블로그

Amazon SageMaker에서 스티키 세션 라우팅을 사용하여 초저지연 멀티모달 생성 AI 애플리케이션 구축

이 포스트에서는 Amazon SageMaker의 새로운 스티키 라우팅 기능을 통해 다중 모드 모델을 제공할 때 최적의 초저 지연 시간을 달성하고 최종 사용자 경험을 향상시킬 수 있는 방법을 설명했습니다.
aws.amazon.com
Build ultra-low latency multimodal generative AI applications using sticky session routing in Amazon SageMaker