RSS 마이크로소프트 팀스 블로그 기사

Microsoft Foundry를 통해 Azure Speech의 새로운 음성 유형인 Dragon HD Omni를 미리 만나보세요

Microsoft Azure Speech에서 Dragon HD Omni를 출시했습니다. 이 새로운 텍스트 음성 변환 기능은 700개 이상의 표현력 풍부한 다국어 음성을 제공합니다. 이 통합 모델은 부자연스러운 운율 및 광범위한 SSML 조정과 같은 일반적인 문제를 해결하여 개발자 통합을 간소화합니다. Dragon HD Omni는 향상된 맥락 적응 기능을 제공하여 각 음성의 고유한 특성을 유지하여 더욱 생생한 음성을 구현합니다. 이 기능은 성별, 나이, 톤에 대한 다양한 옵션을 갖춘 거의 300개의 새로운 AI 생성 음성을 도입하여 개인화 및 브랜드 아이덴티티를 강화합니다. 또한 이 기술은 자연어 설명을 통해 자동 스타일 예측을 가능하게 하여 고급 사용자 정의 및 광범위한 스타일 지원을 제공합니다. 모든 Dragon HD Omni 음성은 다국어이며 다른 언어 및 억양으로 출력을 자동으로 예측하고 생성할 수 있습니다. 이 서비스는 정확한 단어 수준 동기화가 필요한 애플리케이션에 중요한 단어 경계 이벤트를 지원합니다. 개발자는 온도, top_p, top_k 및 cfg_scale과 같은 매개변수를 사용하여 음성 출력을 미세 조정하여 표현력, 안정성, 속도 및 맥락 관련성을 제어할 수 있습니다. Microsoft의 더 광범위한 제품에는 150개 이상의 언어 및 로케일에 걸쳐 600개 이상의 신경망 음성이 포함되며, 고유한 브랜드 음성을 위한 사용자 지정 신경망 음성 기능도 제공됩니다. 사용자는 Speech Playground 및 직접 SSML 호출을 통해 이러한 음성 및 기능을 탐색할 수 있습니다.
favicon
techcommunity.microsoft.com
Introducing Dragon HD Omni: Azure Speech New Voice Type Now in Preview via Microsoft Foundry
Create attached notes ...