1、嵌入式语音技术在解剖学双语教学软件中的应用【关键词】 语音技术;双语教学;计算机辅助教学 摘要目的 应用嵌入式语音合成技术开发医学专业外语教学平台,为提高语言交流能力提供帮助。方法在教学软件设计中调用微软真人语音库 TTS 引擎,实现对程序中文本及其变量的实时朗读发音。加入开始、暂停、继续和语速等控制按钮,加入指令使用户可自行决定选择整篇朗读、单行朗读、自动连续朗读等。设计控件使 TTS 引擎可读取程序嵌入文本,也可朗读用户提取的文本以及输入的文字。结果 通过嵌入微软真人语音库,在程序运行时调用 TTS 引擎,以恰当的控件控制,很好地实现了医学专业外语互动式语言学习环境。结论 本研究成果对医学
2、专业双语教学的语言环境改善,加强学生专业词汇听说能力的培养,提高语言交流能力均有较大帮助。 关键词 语音技术;双语教学;计算机辅助教学 ABSTRACTObjectiveTo study phonetics synthesis technique and develop an educational software for medical-specialty bilingual course. MethodsA software that could load and insert Microsoft SAPI was designed, with which any text on the
3、 screen that user had loaded or typed could be read. The user could control its speed, and decide when to stop, pause and resume. ResultsA useful applet was obtained to assist training of listening and spoken medical English. ConclusionOur study is very helpful to the medical bilingual course, and t
4、he applet is an excellent tool to train listening and spoken English. KEY WORDSphonetic technique;bilingual teaching;computer-assisted instruction 近年来,在高等院校乃至中小学,双语教学日益兴起。尽管目前已有许多外语辅助学习软件,如各类电子词典,但大多只提供查询功能,不能起到就某一专业进行系统的专业外语的学习与训练效果,尤其是听说能力的训练,缺乏互动式语言交流情境1 。利用嵌入式语音技术开发医学专业外语教学软件,能很好地辅助专业外语听说能力的训练。
5、1 材料和方法 1.1 开发软件环境 Microsoft Windows 98 及以上操作系统,装有微软真人英语语音库引擎(Microsoft Text-To-Speech Engine) ,以及基于 Basic 语言的脚本构建平台 Multimedia Builder(加拿大 Media Chance 公司)及相关工具。 1.2 硬件 普通电脑配置,P 733 以上,128 M 内存,至 少 500 M剩余硬盘空间,配有声卡以及立体声音箱。 1.3 语音控件的设置程序启动即引导 TTS 引擎装入内存,使控制语音朗读各种指令处于待命状态,用户要求,马上执行。界面充分考虑使用者对学习内容的灵活选
6、择和对语音朗读的可控性,设立“语音朗读” 、“停止” 、 “暂停” 、 “继续” 、 “语速调节”等控制按钮。并根据不同内容要求,如自我复读测试练习,相应加入“逐行朗读” 、 “隔行朗读” ,并可决定是否继续下一行等指令。 1.4 对朗读文本的设置与优化 为了便于提取和提高运行速度,文档均采取 txt 格式存档。对于单词和短语要求输入正确即可,输入时严格按照文档排版要求,如词与词之间要有间隔,标点符号前不能有空格符。对于段落文档,还要求断句正确,建议尽量使用短句,长句应不多于 20音节(相当于 10 个双音节单词) 。 2 结果 2.1 软件包集成结果 通过对程序语言集成整合,得出小于 1 M
7、 的可执行主程序,且为绿色的软件,不会向操作系统写入任何扩展信息,可实时对选择文本发出标准美式英 语朗读。用户可以记事本 txt 文件自行编写词库,可以是单词、短语和段落,然后在程序中调用。支持用户自定义读音朗读形式,语速可进行灵活设置,支持标准 UNICODE 码,规范的函数调用接口,支持微软 SAPI 的调用,支持 Windows 98/2000/XP/me等操作系统。 2.2 程序测试结果 程序启动引导时间 24 s(不同计算机配置有所差别) ,程序初始时占用内存约 89 M,当启动 TTS 引擎占用内存约912 M。除在朗读中改变语速,会延迟 12 s 后生效外,暂停、继续、连续、各行
8、等指令反应时间均小于 0.1 s。在停止朗读状态下,设置语速,没有延迟现象。语速选定慢速,每分钟 100120 个单词;标准语速,每分钟 130150 个单词;快速是每分钟 150180 个单词。 3 讨论 3.1 语音技术发展现状 按照人类语言功能的不同层次,语音合成可分 成三个层次:从文字到语音的合成(Text-To-Speech); 从概念到语音的合成(Concept-To-Speech);从意向到语音的合成(Intention-To-Speech) 。这三个层次反映了人类大脑中形成语言的不同过程,涉及人类大脑的高级神经活动。不难想像,即使是按规则的文字到语音合成(文语合成)也已经是相当
9、困难的任务。现在技术上的研究进展还没有达到语音合成的第二层次。目前做到第一步可称为文语转换(Text-To-Speech,TTS) ,这个过程是先将文字序列转换成音韵序列,再由语音合成器生成语音波形。其中第一步涉及语言学处理,例如分词、字音转换等,以及一整套有效的韵律控制规则;第二步需要先进的语音合成技术,能按要求实时合成出高质量的语音流。因此一般说来,文语合成系统都需要一套复杂的文字序列到音素序列的转换程序,也就是说,文语转换系统不仅要应用数字信号处理技术,而且必须有大量的语言学知识的支持。由于语音合成系统对于运算和存储资源要求比较高,限制了 TTS 技术的应用范围,过去主要局限在服务器级和
10、桌面级的应用。然而,近几年随着嵌入式技术的蓬勃发展,嵌入式设备越来越受到社会的认同,如嵌入式语音软件开发平台、语音合成板卡、语音合成芯片。其中语音合成板卡和芯片主要是针对不宜以软件方式实现语音合成的应用领域,而用于教育信息化,基于 PC 机,嵌入式语音软件显得更方便实用。3.2 微软英文语音库的优点 本研究采用微软的 MSTTS 引擎,这是一个基于小型语音库的高性能文语合成引擎,是在保证语音质量和表现力的前提下,尽可能地减小语音合成的运算、存储资源消耗,使得系统可以在极小的存储空间内(1 MB 以下)实时实现较高自然度的语音合成。便于桌面型语言学习软件的调用,对硬件的依赖性不高。这是一种新的语
11、音系统,相对于传统的语音压缩、录音回放方式来实现的系统,具有以下两个优点:采用语音合成的系统,需要占用的系统存储容量远远小于基于录音回放技术的系统。对于海量信息数据,录音回放方式实时性无法得到保障,而且费用高、制作周期长,同时信息的保存检索很不方便,使用语音合成以后,这些问题迎刃而解。信息是不断更新变化的,对于动态信息,无法预先录音,因此录音回放方式根本无法解决,只有使用语音合成技术才能解决。 3.3 在双语教学中的应用 在医学专业双语教学中,读写是传统教学的优势,看文献、写文章、考试似乎都没问题,但真正语言交流显得较为薄弱,学生的听说能力仍不尽人意2 ,原因是缺乏语言环境。一个专业词汇,看起
12、来认识,也知道什么意思,但不一定能说出来,即使有音标,读出来听者并不一定能听明白。一般而言,我们的高校教师的母语是中文,英语作为第二语言使用的机会远小于中文,相当一部分教师目前讲英语还不能做到脱口而出,尤其医学的英语名词大部分来源于拉丁语,讲授起来远较公共英语困难,发音严重不准的医学单词极易误导学生,给他们的学习带来困难2 。教师的口语能力及发音的准确性极为关键。因为教师在传授专业知识的同时,也在传授专业英语的读音和读法,学生往往以教师的发音为准,如果教员发音和读法不准确,会耽误学生很多年,影响将来的交流和认知。本研究就是试图设计出辅助医学专业外语学习中能听说的语音环境,提高语言交流能力。把学习中遇到大量的生僻的派生、衍生词只要在屏幕上输成文本,系统就会朗读出来,并可反复跟读,使得语音练习变得十分方便高效。 参考文献 1 杨 明山,顾璜. 医学专业“双语教学”的若干问题J.中国高等医学教育,2003, (3):8. 2 熊 鲲,黄良,曾志成. 人体解剖学实习课双语教学浅谈J.实用预防医学,2003,10(6):1020.