RSS AWS Последние объявления

Модель преобразования текста в речь Cartesia Sonic 3 теперь доступна в Amazon SageMaker JumpStart.

Модель Sonic 3 от Cartesia теперь доступна в Amazon SageMaker JumpStart, расширяя портфель базовых моделей, доступных клиентам AWS. Sonic 3 — новейшая модель пространств состояний (SSM) Cartesia для потокового преобразования текста в речь (TTS), обеспечивающая высокую естественность, точное следование транскрипту и лучшую в отрасли задержку с точным контролем над громкостью, скоростью и эмоциями. Sonic 3 поддерживает 42 языка и обеспечивает расширенное управление с помощью параметров API и тегов SSML для регулировки громкости, скорости и эмоций. Модель включает поддержку естественного смеха, стабильные голоса, оптимизированные для голосовых агентов, и эмоциональные голоса для выразительных персонажей. С задержкой менее 100 мс Sonic 3 обеспечивает разговорный ИИ в реальном времени, который улавливает нюансы человеческой речи, включая эмоции и тональные сдвиги. С помощью SageMaker JumpStart клиенты могут развернуть Sonic 3 всего за несколько кликов, чтобы решить свои задачи голосового ИИ. Чтобы начать работу с этой моделью, перейдите в каталог моделей SageMaker JumpStart в SageMaker Studio или используйте SDK Python для SageMaker, чтобы развернуть модель в своей учетной записи AWS. Для получения дополнительной информации о развертывании и использовании базовых моделей в SageMaker JumpStart см. документацию Amazon SageMaker JumpStart.
favicon
aws.amazon.com
Cartesia Sonic 3 text-to-speech model is now available on Amazon SageMaker JumpStart
Create attached notes ...