基于说话人声音识别的技术研究 语音识别技术.DOC

上传人:bo****9 文档编号:5633897 上传时间:2021-05-27 格式:DOC 页数:4 大小:37.50KB
下载 相关 举报
基于说话人声音识别的技术研究 语音识别技术.DOC_第1页
第1页 / 共4页
基于说话人声音识别的技术研究 语音识别技术.DOC_第2页
第2页 / 共4页
基于说话人声音识别的技术研究 语音识别技术.DOC_第3页
第3页 / 共4页
基于说话人声音识别的技术研究 语音识别技术.DOC_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

精品文档,欢迎下载基于声音的说话人身份信息识别技术研究通信1203班成员:艾洲、刘安邦、汪中日余文正、王玉贵、宁文静2014-12-28项目背景伴随着全球化、网络化、信息化、数字化时代的到来,我们对高可靠性的身份验证技术与身份识别技术的需求也日益增长。在生物学和信息科学高度发展的今天,根据人体自身的生理特征(指纹、虹膜)和行为特征(声音“线性预测系数LPC”相比更好,更符合人耳的听觉特性,而且当信噪比降低时仍然具有较好的识别性能。MFCC倒谱特征提取流图1.预加重预加重处理其实是将语音信号通过一个高通滤波器:式中的值介于0.9-1.0之间,我们通常取0.97。预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱。同时,也是为了消除发生过程中声带和嘴唇的效应,来补偿语音信号受到发音系统所抑制的高频部分,也为了突出高频的共振峰2.分帧先将N个采样点集合成一个观测单位,称为帧。通常情况下N 的值为256或512,涵盖的时间约为2030ms左右。为了避免相邻两帧的变化过大,因此会让两相邻帧之间有一段重叠区域,此重叠区域包含了M个取样

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 策划方案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。