Компания OpenAI объявила, что предоставляет сторонним разработчикам доступ к своей системе преобразования речи в речь, на которой основан усовершенствованный голосовой режим ChatGPT. Ожидается, что этот шаг приведет к разработке приложений с искусственным интеллектом с голосовым интерфейсом. Среди первых тестеров функции — Healthify, приложение для питания и фитнеса, и Speak, приложение для изучения языков. Помимо механизма преобразования речи в речь, разработчики также смогут уточнять модели на основе изображений. OpenAI продемонстрировал новые аудиовозможности с помощью вызова виртуального помощника в вымышленный кондитерский магазин и размещения заказа с помощью API Twilio. Доступные разработчикам голоса будут такими же, как и в ChatGPT. Однако разработчики не смогут использовать собственные голоса. Условия обслуживания OpenAI запрещают использовать его системы для спама или введения людей в заблуждение. Компания не требует от разработчиков указывать водяной знак на голосе или идентифицировать систему искусственного интеллекта. Ожидается, что эта новая функция позволит создавать более продвинутые голосовые интерфейсы на базе искусственного интеллекта.
developers.slashdot.org
OpenAI Opens Its Speech AI Engine To Developers
Create attached notes ...
