语音识别软件
高级搜索    收藏本站    儿歌软件    我爱宝宝网  
热门关键字:  去噪声  语音识别代码  英才  语音识别  语音识别芯片
当前位置 :| 主页>语音合成>

TTS语音合成引擎评测

来源: 作者: 时间:2009-03-22 Tag:语音合成   点击:

TTS的全称为(Text To Speech)即语音合成,又称文语转换技术。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,而通过计算机语音合成则可以在任何时候将任意文本转换成具有高自然度的语音。

序言:

TTS的全称为(Text To Speech)即语音合成,又称文语转换技术。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,而通过计算机语音合成则可以在任何时候将任意文本转换成具有高自然度的语音。使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感,可以听到清晰悦耳的音质和连贯流畅的语调。

导读:

:中国科大讯飞是国家863计划中唯一以语音技术为主要产业化方向的高科技企业。其基于语料库的波形拼接合成技术即从录制的大规模自然语流数据库中按照合适的声学、语音学算法提取合适的单元合成出连续的语流。在合成系统的实现过程中,充分运用语言学、语音学、统计分析、人工智能、数字信号处理等的先进技术,一切从人类语音自然的角度出发,使合成的语音自然度超过普通人说话的水平。现已被国内外专家公认为具有世界最高水平的汉语语音合成技术。

美国NeoSpeech公司是一家语音功能解决方案的领先供应商。拥有在语音识别、语音合成等方面超强的技术实力。其语音产品可以产生自然、清晰的真人声音,并提供相应的文字转换语音解决方案,同时支持广泛的行业标准,提供了最高质量水平的准确性。

美国Nuance公司是一家全球知名的国际性企业,专业从事商业应用软件的研究开发,是世界上最优秀的语音技术供应商之一,其多语种语音合成技术领域拥有全球语种最丰富的语音合成技术,其语音识别引擎(ScanSoft),在识别率、识别速度、系统稳定性等方面都处于行业领先的地位。

微软公司是全球最大得领先软件开发企业,产品涉及各个方面。它也推出了一系列的语音引擎(包括SR和SS),同时还推出的SAPI进行语音开发,SAPI本身并不能做任何事情,只提供了一系列接口,处于应用软件与语音引擎之间,隔离了应用软件与语音引擎之间的联系,使得语音引擎的更换不会影响到原有应用程序的运行。

测评环境

参评软件

如何测试:

我们这次测试的重点是中文及中英文混读的语音(音色和音质)效果。对于TTS语音合成引擎(语音库)的考核可以借助语音朗读软件来测试。在这里我们选择功能比较全面,知名度也比较高的免费朗读软件“听网页”,能调用多种语音合成引擎,并支持文字变声音电脑听;批量转换文本文件到MP3随身听两大核心功能。(科大讯飞的中文语音库网上没有单独下载,好不容易只找到了讯飞的文语通朗读软件和讯飞语音合成WEB版软件,就用它们来测试讯飞语音引擎了)另外本次评测只是基于个人的主观感受测试,而非对其核心功能(例如:如何具体实现文语转换技术等)的论述,也不是对TTS朗读软件的评测。总之通过它们的对比,就可以定性一个TTS语音引擎是否优秀。下面我们就开始全面的性能测试。

测试主题:

1、 清晰度2、准确度3流畅度4、自然度

点评:

科大讯飞通过文语通测试语音效果比较优秀;语音合成WEB版测试效果也很好,就是流畅度较差,断断续续(我想应该和网络有关,网络速度越快,越通畅,流畅度就应该越好);在线演示提供了两种语音引擎,用户可以选择语音库,但要输入验证码,效果非常优秀,就是等待的时间有点长。

NeoSpeech通过听网页测试效果比较优秀,但等待的时间太长。

ScanSoft通过听网页测试效果良好,在线演示必须要把文本转化成.WAV格式下载到本地,等待的时间太长,并且在线转换后的.WAV文件准确性很差,不知道是什么原因,可能是支持的中文编码问题(GB和大BIG)但应该和语音引擎没有关系。

Microsoft通过听网页测试效果不太好。但它的强项在于对第三方语音引擎(库)的支持

 

评测总结

通过实际的中英文听感测试,我们可以得出:在清晰度、准确度、流畅度、自然度四大方面,科大讯飞NeoSpeech、ScanSoft都处理业界领先的地位,其语音合成的音质和音感都非常出色。虽然即使采用同一语音引擎的不同朗读软件可能朗读效果会有所不同,但应该和语音引擎本身没什么关系。只有微软自己提供的中文语音引擎,效果比较差,但可以理解,这不是它的专长,它的优势在于集成更多的第三方语音引擎提供给用户使用。总的来说,在本次评测中,我们国产的讯飞中文语音引擎是最大的赢家,它的语音合成效果可以说是非常出色,获得冠军可以说是理所当然,遗憾之处就是整个互联网竟然没有单独的讯飞语音库可以下载,看来讯飞公司比较小气,真是只铁公鸡,哈哈。还有个消息透露给大家(就是科大讯飞2008年5月12在深交所A股上市了,代码002230)。

以上评述难免有所遗漏及缺陷,只代表个人体验观点,欢迎各位读者批评指正!


最新评论共有 2 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册