基于DSP的语音遥控器设计.docx

上传人:h**** 文档编号:128957 上传时间:2018-07-09 格式:DOCX 页数:100 大小:1,003.27KB
下载 相关 举报
基于DSP的语音遥控器设计.docx_第1页
第1页 / 共100页
基于DSP的语音遥控器设计.docx_第2页
第2页 / 共100页
基于DSP的语音遥控器设计.docx_第3页
第3页 / 共100页
基于DSP的语音遥控器设计.docx_第4页
第4页 / 共100页
基于DSP的语音遥控器设计.docx_第5页
第5页 / 共100页
点击查看更多>>
资源描述

1、目录 中文摘要 .3 ABSTRACT. 4 第 1章 绪论 .5 1.1 语音识别的 背景 意义和现状 .5 1.2 语音识别遇到的难题 .6 1.3 红外技术现状 .7 1.4 本论文的主要内容 .9 1.5 本文组织结构 .9 第 2 章 语音识别理论基础 .10 2.1 语音识别 概述 .10 2.2 语音生成系统的数字描述 .13 2.3 语音信号分析技术 .14 2.3.1 概述 .14 2.3.2 滤波与 A/D 转换 .15 2.3.3 预处理 .15 2.3.4 语音信号的时域分析 .16 2.3.5 语音信号的线形预测分析 .17 2.4 语音信号识别技术 .17 2.4.

2、1 矢量量化技术 .17 2.4.2 隐马尔可夫模型 .18 2.5 DAC 方式语音输出 .19 第 3 章 语音遥控器的需求分析 .19 3.1 功能需求分析 .19 3.1.1 功能划分 .19 3.1.2 功能模块介绍 .20 3.2 性能需求分析 .21 第 4 章 语音遥控器的设计 .22 4 1 系统总体设计 .22 4 2 语音识别系统设计 .24 4 3 红外控制系统设计 .25 第 5 章 语音 遥控器的实现 .26 5.1 语音识别系统的实现 .26 5.2 红外遥控电路 .38 第 6 章 系统硬件设计 .39 6.1 TMS320VC5402 的硬件资源 .39 6.

3、2 TMS320VC5402 最小系统设计 .40 6.3 TMS320VC5402 的电源设计 .42 6.4 电路设计 .43 第 7 章 系统软件开发 .45 第 8 章 结束语 .47 参考文献 .48 附录一 .49 附录二 .50 摘要 随着信息时代的来临,电视机产品层出不穷。从最初黑白电视机到彩色电视 机,到 CRT、 LED 电视机,直到今天非常流行的网络电视机等等。从手动控制的电视机到红外遥控电视机,电视机已经成为人们生活不可缺少的一部分。但是随着电视机信号频道的增加,人们发现要快速找到想要的频道是件比较困难的事情。与此同时,在近二十年的时间里红外技术的成熟使得红外产品已经深

4、入到国民经济的各种领域。而语音识别技术在近十年时间里也越来越成熟。因此笔者根据市场形势和技术发展,结合红外领域和语音识别领域的知识,设计和开发了这一款人 语音 控制的电视机遥控器。 本系统选用 TI 公司的 TMS320VC5402 芯片 。 在上面实现了红外遥控系统和语音识别系统,并把两者结合起来。首先通过片上麦克风进行语音信号采集,然后DSP 对语音信号进行预处理和特征提取,接着进行语音识别,最后红外遥控系统根据识别结果发出相应的控制命令来达到对电视机的控制。系统的核心算法是LPCC特征提取法、 DTW语音识别算法和 HMM语音识别算法。根据实际情况的不同,LPCC 特征提取过程采用了短时

5、能量和短时过零率两者结合的办法进行严格的端点检测。系统主要采用了更高效更简便的 DTW 识别算法,而 HMM 算法作为一种对比算法。 希望通过这样一款声控遥控器的研 发,能够为红外技术和语音识别技术的结 合运用到更多领域起到参考作用。 关键词 : 语音识别,红外,数字信号处理器, LPCC, DTW ABSTRACT With the information age coming, TV products emerge one after another There is the initial black and white TV,color TV,CRT TV,LED TV and so

6、on And nowadays Network TV is very popular From the Manually controlled TV to the IR remote controlled TV,Television has become an indispensable part ofpeople s lives However,it is hard to find the right channel with the increasing count of TV signal channels At the same time,in the past two decades

7、 the infrared technology and infrared products have been deep into the various areas of national economy The voice recognition technology becomes more and more mature in decades This author,according to market situation and technological development,combined with the knowledge of infrared field and

8、voice recognition field, design and develop the Voice-activated remote control. The system used in Taiwan Elan provided TMS320VC5402DSP chip We implement theinfrared remote control system and the voice recognition system on this DSP chip and to combine the two For the first step,acquisition voice si

9、gnal through chip microphone And then, the DSP pre-process the voice signal and do feature extraction And next, recognize the voice signal For the last step, infrared remote control system sends the IR orders which based on the result of recognition Core of the system is the LPCC feature extraction

10、algorithm, DTW speech recognition algorithm and the HMM recognition algorithm LPCC feature extraction process using both short-term energy and zero crossing rates to do endpoint detection System mainly uses the more efficient and easier DTWrecognition algorithm, the HMMalgorithm as a comparison meth

11、od Hope to be useful for the using of infrared technology,voice recognition technology and the combination of the two KEY WORD: VOICE RECOGNITION, INFRA RED, DSP,LPCC, DTW 第 1 章绪论 语言是人类特有的功能,是人们思维最重要的寄托体,是人类交流最主要的途径。语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段。语言和语音与人类社会科学文化发展紧密相连。语音识别技术是一种让机器接收、识别和理解语音信号,并将其转换

12、成相应的数字信号的技术。它是一门交叉学科,涉及到语音语言学、数理统计、计算机、信号处理等一系列学科。 1 1 语音识别的 背景、 意义和现状 人的成长过程就是一个不断获取外界信息,不断传播信息的过程。获取吸收 信息,和传播信息有很多方式,而其中最直接、最有效、最容易理解 的途径就是 语言表达。语言和声音非常丰富,可以表达其他方式无法表达的细微情感。物种 的语言水平一定程度上直接表明了该物种的高级程度,也反映了社会和文化水平,更是文化遗产传承的重要媒介。 人与人之间的语言交流似乎无比的寻常,那是因为人们从呱呱坠地那一刻就 开始通过声音和语言跟外界交流信息,经过长时间的积累掌握了语言的“密码”。

13、但是要与一台机器进行语言交流就显得那么的遥不可及,我们也只能在科幻电影 里面才能幻想一下。然而随着计算机技术的飞速发展,与机器进行一定程度的语 言交流成为了现实,提供方法的就是 语言识别技术。有了语言识别技术,人们就 可以脱离鼠标和键盘的束缚,与计算机建立直接的语言交流。 语音识别的研究已经涉及到人工智能、模式识别、微机技术、数字信号处理、 语言声学、语音编码和认知科学等很多学科领域,是一个多学科的综合性研究领域,具有重要的学术价值和应用价值。 从 20 世纪 50 年代 AT而对后者,机器能识别任意人的发音。由于语音信号的可变性很大,这种系统要能从大量的不同人 (通常 3040人 )的发音样

14、本中学习到非特定人的发音速度、语音强度、发音方式等基本特征,并归纳出其相似性作为识别的标准。 使用者无论是否参加过训练都可以共用一套参考模板进行语音识别。从难度上看,特定说话人的语音识别比较简单,能得到较高的识别率,武汉理工大学硕士学位论文并且目前己经有商品化的产品 ;而非特定人识别系统,通用性好、应用面广,但难度也较大,不容易获得较高的识别率。 第二,按照词汇量大小来分,可以分为小词汇量,中等词汇量和大词汇量三种。通常 100以下的为小词汇量系统, 100以上 1000以下为中等词汇量系统, 1000词以上为大词汇量系统。 第三,按照发音方式分,可以分为孤立词,词组和连续语音识别三种。孤立词是诸如 0到 9数码,一些菜单操作命令等无语法含义的单个词。目前孤立词的主

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。