RSS Статьи блога Microsoft Teams

Представляем Dragon HD Omni: новый тип голоса Azure Speech теперь доступен в предварительной версии через Microsoft Foundry

Microsoft Azure Speech представляет Dragon HD Omni, новое поколение генерации текста в речь, в котором представлено более 700 выразительных, многоязычных голосов. Эта унифицированная модель упрощает интеграцию для разработчиков, решая общие проблемы, такие как неестественная просодия и обширная настройка SSML. Dragon HD Omni предлагает улучшенную контекстную адаптацию, сохраняя уникальный характер каждого голоса для более похожей на человеческую речи. Она вводит почти 300 новых голосов, сгенерированных с помощью ИИ, с разнообразными вариантами пола, возраста и тона, что позволяет добиться большей персонализации и идентичности бренда. Эта технология также позволяет автоматически предсказывать стиль через естественные языковые описания, предлагая расширенную настройку и более широкую поддержку стилей. Все голоса Dragon HD Omni являются многоязычными и способны автоматически предсказывать и генерировать вывод на разных языках и акцентах. Сервис поддерживает события границ слов, необходимые для приложений, требующих точной синхронизации на уровне слов. Разработчики могут тонко настраивать выходной голос, используя параметры, такие как температура, top_p, top_k и cfg_scale, для управления выразительностью, стабильностью, скоростью и контекстной актуальностью. Более широкое предложение Microsoft включает более 600 нейронных голосов по более чем 150 языкам и локализациям, с возможностью создания пользовательских нейронных голосов для уникальных голосов бренда. Пользователи могут изучать эти голоса и функции через Speech Playground и прямые вызовы SSML.
favicon
techcommunity.microsoft.com
Introducing Dragon HD Omni: Azure Speech New Voice Type Now in Preview via Microsoft Foundry
Create attached notes ...