Cartesia의 Sonic 3 모델, Amazon SageMaker JumpStart에서 출시
Cartesia의 Sonic 3 모델이 이제 Amazon SageMaker JumpStart에서 제공되어, AWS 고객에게 제공되는 파운데이션 모델 포트폴리오가 확장되었습니다. Sonic 3는 Cartesia의 최신 스트리밍 텍스트 음성 변환(TTS)을 위한 상태 공간 모델(SSM)로, 높은 자연스러움, 정확한 스크립트 준수, 그리고 볼륨, 속도, 감정에 대한 세밀한 제어를 통해 업계 최고의 지연 시간을 제공합니다.
Sonic 3는 42개 언어를 지원하며, API 매개변수 및 SSML 태그를 통해 볼륨, 속도, 감정을 조절할 수 있는 고급 제어 기능을 제공합니다. 이 모델은 자연스러운 웃음 지원, 음성 에이전트에 최적화된 안정적인 음성, 그리고 표현력 있는 캐릭터를 위한 감성적인 음성을 포함합니다. 100ms 미만의 지연 시간으로 Sonic 3는 감정과 음조 변화를 포함한 인간의 음성 뉘앙스를 포착하는 실시간 대화형 AI를 가능하게 합니다. SageMaker JumpStart를 통해 고객은 몇 번의 클릭만으로 Sonic 3를 배포하여 음성 AI 사용 사례를 해결할 수 있습니다. 이 모델을 시작하려면 SageMaker Studio에서 SageMaker JumpStart 모델 카탈로그로 이동하거나 SageMaker Python SDK를 사용하여 모델을 AWS 계정에 배포하십시오. SageMaker JumpStart에서 파운데이션 모델을 배포하고 사용하는 방법에 대한 자세한 내용은 Amazon SageMaker JumpStart 문서를 참조하십시오.
aws.amazon.com
Cartesia Sonic 3 text-to-speech model is now available on Amazon SageMaker JumpStart
Create attached notes ...
