Speechz Text to speech 1.0

许可: 免费 ‎文件大小: N/A
‎用户评分: 0.0/5 - ‎0 ‎评分

语音文本到语音

语音合成是人类语音的人工制作。用于此目的的计算机系统称为语音合成器,可以在软件或硬件产品中实现。文本到语音转换 (TTS) 系统将普通语言文本转换为语音;其他系统将符号语言表示(如语音转录)呈现到语音中。[1] 合成语音可以通过连接存储在数据库中的录制语音片段来创建。系统存储的语音单元的大小不同;存储手机或二元电话的系统提供最大的输出范围,但可能不够清晰。对于特定的使用域,存储整个单词或句子允许高质量的输出。或者,合成器可以合并声带模型和其他人类语音特征,以创建一个完全"合成"的语音输出。[2] 语音合成器的质量是由它与人的声音的相似性和理解能力来判断的。可理解的文本到语音视频程序允许有视觉障碍或阅读障碍的人在家里的计算机上收听书面作品。自20世纪90年代初以来,许多计算机操作系统都包括语音合成器。

典型 TTS 系统的概述

自动公告 菜单0:00 一个合成的声音宣布抵达瑞典的火车。 播放此文件时遇到问题?请参阅媒体帮助。

微软山姆示例 菜单0:00 微软WindowsXP的默认语音合成器的声音说:"快速棕色狐狸跳过懒惰的狗1,234,567,890次。苏伊" 播放此文件时遇到问题?请参阅媒体帮助。 文本到语音系统(或"引擎")由两部分组成:[3] 前端和前端。前端有两个主要任务。首先,它将包含数字和缩写等符号的原始文本转换为与写出的单词等效的文本。此过程通常称为文本规范化、预处理或标记化。然后前端为每个单词分配音标,并将文本划分并标记成专业单位,如短语、子句和句子。将音文本转录分配给单词的过程称为文本到电话或石墨到电话转换。音质转录和假信息共同是前端输出的符号语言表示形式。后端\mdash;通常被称为合成器—然后将符号语言表示转换为声音。在某些系统中,此部分包括目标算法的计算(音高轮廓、音质持续时间),[4],然后强加给输出语音。

版本历史记录

  • 版本 1.0 发布于 2013-10-06

软件信息