第6章 智能机器人的语音合成与识别 语言是人类最重要的交流工具,自然方便、准确高效。让机器与人之间进行自然语言交流是智能机器人领域的一个重要研究方向。语音识别和语音合成技术、自然语言理解是建立一个能听会讲的口语系统,从而实现人机语音通信所必需的关键技术。 语 音合成与识别 技术 涉及语 音声学、数字信号处 理、人工智能、微机原理、模式识别 、语 言学和认 知科学等众多前沿科学,是一个涉及面很广的综 合性科学,其研究成果对 人类 的应用领 域和学术领 域都具有重要的价值 。近年来,语 音合成与识别 取得显 著进 步,逐渐 从实验 室走向市场 ,应 用于工业 、消费电 子产 品、医疗 、家庭服务 、机器人等各个领 域。 图6.1 语音合成技术原理示意图6.1 语音合成的基础理论 语音合成是指由人工通过一定的机器设备产生出语音。具体方法是利用计算机将任意组合的文本转化为声音文件,并通过声卡等多媒体设备将声音输出。简单的说,就是让机器把文本资料“读”出来。 由图6.1可知,语音合成系统完成文本到语音数据的转化过程中可以简单分为两个步骤: (1) 文本经过前端的语法分析,通过词典和规则的处理,得