TTS引擎用于实现文本到语音的转换。随着人工智能的普及以及数字设备应用的增加,相关系统对语音识别以及文语转换技术日益依赖,TTS正在变得越来越重要。
10年积累的成都做网站、成都网站建设经验,可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你,你也不认识我。但先网站设计后付款的网站建设流程,更有长岛免费网站建设让你可以放心的选择与我们合作。
在这项技术的帮助下,可以将文本内容转换为录音。可以帮助视觉障碍的人理解文本内容,可以让开车的人听取一个文本工作报告,甚至模拟某个人的声音播报一段内容、演唱一个歌曲,实现虚拟主播、虚拟歌手。
本文主要查找收集了一些较好的开源TTS引擎。这些项目有助于我们更加了解TTS的功能。
https://github.com/coqui-ai/TTS
这是一个在研究和生产中经过了实战考验的TTS深度学习工具包,可以以200毫秒的延迟进行流传输,支持13种语言(包括中文)。
https://github.com/mozilla/TTS
TTS是一个用于文本到语音生成的高级库。旨在实现易于训练、高速度和高质量的最佳平衡。 提供预训练模型,以及用于测量数据集质量的工具,支持用于产品和研究的20多种语言,包括支持中文。
https://github.com/synesthesiam/opentts
OpenTTS是TTS最有效的开源模型之一。因为该模型支持包括中文在内的多种语言。
https://github.com/marytts/marytts
MARY Text-to-Speech 语音合成是一个多语言TTS平台,支持英语(英国和美国)、法语、德语、意大利语、俄语等语言。
产品特点:
https://github.com/espeak-ng/espeak-ng
eSpeak是一个紧凑的开源TTS引擎,可运行于Windows和Linux。支持100多种语种和语音(包括中文普通话)。
产品特点:
https://github.com/MycroftAI/mimic3
Mimic是一个快如闪电的开源TTS引擎。
产品特点:
目前,该工具正在为患有语言障碍的人带来逼真的声音。
https://github.com/festvox/flite
Festival Lite通常被称为Flite。它是一个小型的运行时引擎,被认为是最快的TTS引擎之一。
由于它是一个开源引擎,并且是免费的,可以基于这个项目做许多自定义功能。因此,许多公司都选择了这个TTS引擎。
核心特点:
https://github.com/numediart/MBROLA
MBROLA是Multi-Band Resynthesis OverLap Add的缩写,也是最常用的开源TTS引擎之一。它支持多种语言。
功能特点:
https://github.com/ranchlai/mandarin-tts
这是一个模块化的中文普通话TTS语音合成框架,旨在支持研究和快速产品开发。
主要功能包括:
https://github.com/atomicoo/FCH-TTS
一个快速语音合成模型,适用于英语、普通话/中文、日语、韩语、俄语和藏语。
https://github.com/rhasspy/piper
piper是一个快速的本地语音合成系统,并针对Raspberry Pi 4(树莓)进行了优化。 支持包括中文在内的多种语言。
使用DEMO如:
echo 'Welcome to the world of speech synthesis!' | \
./piper --model en_US-lessac-medium.onnx --output_file welcome.wav
分享名称:11个优秀开源TTS引擎
文章出自:http://www.mswzjz.cn/qtweb/news36/57086.html
攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能