精品文档,欢迎下载基于声音的说话人身份信息识别技术研究通信1203班成员:艾洲、刘安邦、汪中日余文正、王玉贵、宁文静2014-12-28项目背景伴随着全球化、网络化、信息化、数字化时代的到来,我们对高可靠性的身份验证技术与身份识别技术的需求也日益增长。在生物学和信息科学高度发展的今天,根据人体自身的生理特征(指纹、虹膜)和行为特征(声音“线性预测系数LPC”相比更好,更符合人耳的听觉特性,而且当信噪比降低时仍然具有较好的识别性能。MFCC倒谱特征提取流图1.预加重预加重处理其实是将语音信号通过一个高通滤波器:式中的值介于0.9-1.0之间,我们通常取0.97。预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱。同时,也是为了消除发生过程中声带和嘴唇的效应,来补偿语音信号受到发音系统所抑制的高频部分,也为了突出高频的共振峰2.分帧先将N个采样点集合成一个观测单位,称为帧。通常情况下N 的值为256或512,涵盖的时间约为2030ms左右。为了避免相邻两帧的变化过大,因此会让两相邻帧之间有一段重叠区域,此重叠区域包含了M个取样