Сообщество RSS DEV

Я построил автономный движок преобразования текста в речь с 1,6 миллионами параметров для Node.js — вот как.

Разработчик представляет TinyTTS, проект преобразования текста в речь, разработанный для сред с ограниченными ресурсами. Основной целью было создание решения TTS, простого в использовании в Node.js, избегая зависимости от облачных сервисов, Python или больших моделей. TinyTTS создан с нуля и использует компактную модель с 1,6 миллионами параметров для эффективного синтеза речи. Он оснащен моделью ONNX размером ~3,4 МБ и обеспечивает высококачественный вывод 44,1 кГц. Проект достигает примерно 53-кратной производительности в реальном времени на процессоре ноутбука, что делает его подходящим для устройств с ограниченными ресурсами. TinyTTS не имеет зависимостей от Python и обеспечивает согласованный вывод с его аналогом на Python. Проект легко устанавливается через npm и может использоваться с простым API или CLI. Архитектура включает обработку текста с последующей генерацией фонемы, а затем использование модели ONNX для создания WAV-файла. По сравнению с существующими решениями, TinyTTS предлагает баланс качества, размера и простоты использования. Проект фокусируется на улучшении качества голоса, поддержке нескольких языков и расширении библиотеки голосов. Предоставлены ссылки на npm, PyPI, GitHub и живую демонстрацию, чтобы пользователи могли подробнее изучить проект. Разработчик активно ищет отзывы и примеры использования для улучшения разработки проекта.
favicon
dev.to
I Built a 1.6M-Parameter Offline Text-to-Speech Engine for Node.js — Here's How
Create attached notes ...