오늘, 아마존은 자연스럽고 실시간 대화형 AI를 위한 음성-음성 모델인 Amazon Nova 2 Sonic의 출시를 발표합니다. 이 모델은 음성 기반 대화형 AI 분야에서 업계 최고의 품질과 가격을 제공합니다. 배경 소음과 사용자의 발화 스타일에 대한 강력한 내성을 갖춘 동급 최고의 스트리밍 음성 이해, 효율적인 대화 처리, 여러 언어(Polyglot 음성)로 네이티브하게 말할 수 있는 표현력 있는 음성을 갖춘 음성 생성을 제공합니다. 이전 모델보다 뛰어난 추론, 지시 따르기, 도구 호출 정확도를 자랑합니다.
Nova 2 Sonic은 기존 Nova Sonic 모델에서 도입된 기능들을 기반으로 구축되었으며, 확장된 언어 지원(포르투갈어 및 힌디어), 동일한 음성을 사용하여 다양한 언어를 네이티브한 표현력으로 말할 수 있는 Polyglot 음성, 개발자가 낮은, 중간, 또는 높은 일시 정지 감도를 설정할 수 있도록 하는 턴 테이킹 제어 기능과 같은 새로운 기능을 추가했습니다. 또한, 이 모델은 교차 모달 상호 작용을 추가하여 사용자가 동일한 세션에서 음성과 텍스트 간에 원활하게 전환할 수 있도록 하고, 대화 흐름을 방해하지 않고 다단계 작업을 지원하는 비동기식 도구 호출, 그리고 지속적인 상호 작용을 위한 100만 토큰 컨텍스트 창을 제공합니다.
개발자는 Amazon Bedrock의 양방향 스트리밍 API를 사용하여 Nova Sonic 2를 실시간 음성 시스템에 직접 통합할 수 있습니다. Nova Sonic 2는 이제 Amazon Connect 및 Vonage, Twilio, AudioCodes를 포함한 기타 주요 전화 통신 제공업체뿐만 아니라 LiveKit 및 Pipecat과 같은 오픈 소스 프레임워크와도 원활하게 통합됩니다.
Amazon Nova 2 Sonic은 다음 AWS 리전에서 Amazon Bedrock에서 사용할 수 있습니다: 미국 동부 (버지니아 북부), 미국 서부 (오레곤), 아시아 태평양 (도쿄), 유럽 (스톡홀름). 자세한 내용은 AWS 뉴스 블로그 및 Amazon Nova Sonic 사용자 가이드를 참조하십시오. Amazon Bedrock에서 Nova Sonic 2를 시작하려면 Amazon Bedrock 콘솔을 방문하십시오.
aws.amazon.com
Announcing Amazon Nova 2 Sonic for real-time conversational AI
