开发者介绍了 TinyTTS,这是一个专为低资源环境设计的文本转语音(TTS)项目。其主要目标是打造一款易于在 Node.js 中使用的 TTS 解决方案,避免依赖云服务、Python 或大型模型。TinyTTS 从零开始构建,采用仅含 160 万个参数的紧凑模型,以实现高效的语音合成。该项目配备约 3.4 MB 的 ONNX 模型,可提供高质量 44.1 kHz 的音频输出。在笔记本电脑 CPU 上,TinyTTS 可实现约 53 倍实时性能,适用于资源受限的设备。该项目无需任何 Python 依赖,并能与 Python 版本保持一致的输出效果。通过 npm 即可轻松安装,支持简洁的 API 或命令行接口(CLI)。其架构包括文本处理、音素生成,随后利用 ONNX 模型生成 WAV 文件。与现有方案相比,TinyTTS 在音质、体积和易用性之间取得了良好平衡。目前项目正致力于提升语音质量、支持多语言以及扩展语音库。开发者提供了 npm、PyPI、GitHub 以及在线演示的链接,供用户进一步探索。同时,开发者积极寻求反馈和边缘场景用例,以推动项目的持续改进。
dev.to
I Built a 1.6M-Parameter Offline Text-to-Speech Engine for Node.js — Here's How
