1、第 1 页 共 39 页语音信号的降噪处理及滤波器的设计摘 要自适应滤波技术和超大规模集成电路(VLSI)技术的迅速发展与应用 为降噪研究提供了理论和技术支持。自适应噪声抵消系统能从被噪声干扰的环境中检测提取有用信号。本文设计了一个自适应噪声抵消系统,使其能减弱含噪语音信号中背景噪音,达到提高语音信号质量的目的。本文介绍了自适应数字滤波器的基本原理思想,具体阐述了自适应噪声抵消系统的基本原理,并对自适应噪声抵消系统的指标和抵消性能进行了计算分析。自适应滤波器的算法是整个系统的核心,对两种最基本的自适应算法,即最小均方误差(LMS )算法和递归最小二乘(RLS)算法进行了详细的介绍和分析,并针对
2、两种算法的优缺点进行了详细的比较。这一部分中最关键的是对设计的噪声抵消系统进行计算机仿真,验证系统设计的合理性和算法的正确性。通过对自适应噪声抵消器的 MATLAB 仿真及对仿真图形的分析,验证了系统设计和自适应算法的可行性。关键词:自适应滤波,LMS 算法,RLS 算法。第 2 页 共 39 页Reduction of the noise for speech signals and filter designABSTRACTWith the development of the technology in the adaptive filter and the very large sca
3、le integration (VLSI), it offers the theory and technical support for studying to cancel noises in system. The adaptive noise canceling system can pick up and detect the useful signal. This dissertation designing an adaptive noise canceling system, it can eliminate noise of background and improve qu
4、ality of phonic signal. The article introduced the basic theory of adaptive filter and adaptive noise canceling system .It analyse the index and function of the adaptive noise canceling system. The adaptive algorithm is the essence of the system. In this part, the article introduced and compared two
5、 basic algorithms, the LSM and RLS algorithm .The most important point in this part is simulinking by MATLAB and analyzing the result of simulinking which prove the feasibility of the design and algorithm.Key Words: Adaptive Filter, LMS Algorithm, RLS Algorithm.第 3 页 共 39 页1 绪论11 论文研究的目的及意义本论文研究的目的是
6、学习语音信号的降噪处理与滤波器设计的方法原理,并能够设计出处理方案,运用 MATLAB 语言编程设计合理的滤波器来去除语音信号中的噪声,参照处理图形研究分析,使之达到优化效果。随着科学技术的进步,数字信号处理的研究有了前所未有的发展。在高科技下各个领域对语音信号的准确性提出了更高的要求。由于语音信号和人的智力活动密切相关,与社会公共事业紧密相连,又是极易被噪声感染的信号,它的降噪处理显得尤为重要,而且在公安、新闻、历史资料、语音识别、通讯等领域有广泛的应用。语音识别领域:当今语音识别是一个非常热门的话题,有许多人在研究,市场上已经出现了不少产品,例如 IBM 的语音识别系统 Via voice
7、.。但是它们有一个共同的弱点,就是识别率并不是很高。其中一个主要原因是噪声对提取语音信号中特征值的影响。所以先对输入的语音信号进行适当的降噪处理是非常有必要的,处理效果的好坏直接影响到语音识别系统的识别率,意义很大。通讯领域:在通讯系统中,由于线路带宽的限制,语音信号的采样频率往往比较低,如电话语音的采样频率为 8000Hz,再加上各种设备产生的电噪音,冲击噪音的影响,使得语音信号的质量降低,可听程度变差,所以也需要对这些语音信号进行降噪处理,提高它们的可听程度。历史资料领域:对于一些历史资料,特别是历史资料中的语音资料,由于当时条件的限制,往往不能将当时的语音信号很好的入录下来,影响了它的使
8、用价值和纪念价值。例如,有不少名人的演讲,由于各种条件的限制,使得演讲录音中掺杂着噪音,影响了效果。所以对于这种演讲录音进行降噪处理就显得尤为重要。新闻领域:对记者来讲,野外采访是常有的事,然而由于采访地点周围环境的影响,如风声、汽车喇叭声、建筑工地的打桩声等等,他所采访到的录音往往会被周围的噪音所污染,影响了采访效果。这时也需要对采访录音进行降噪处理,以便让听众能够更清楚地听到记者和被采访者之间的对话。公安领域:公安干警往往会窃听犯罪嫌疑人的对话。由于周围环境的影响,所用第 4 页 共 39 页设备的限制和犯罪嫌疑人讲话的清晰程度,使得录入的语音信号或多或少会受到噪音的干扰。这对能否听清楚犯
9、罪嫌疑人话中的意思,知道他们的意图带来了很大的困难。如果我们能去除语音信号中的背景噪音,提高语音信号的信噪比,就能使公安干警听出犯罪嫌疑人讲话的意思,这将对防止刑事案件的发生或加快破案进程起到积极的作用。通常情况下,我们所关心的数字信号往往会被其它噪声信号所污染甚至淹没,即在我们所关心的待识别信号中掺杂着噪声,干扰了我们的听辨。这就给有用信号的获取、识别以及检测带来了很大的困难,在不少领域里影响了人们的工作效果。本课题对语音信号进行有效的降噪处理,得到理想的语音信号,对语音信号的进一步识别具有现实的意义。12 语音信号研究的发展史语音信号研究是近几十年发展起来的新兴学科,在计算机、信息处理、通
10、讯与电子系统自动控制等领域中,在工业、军事、医学、交通、航空及民用等诸多方面有广泛的应用。50 年代,是语音信号研究的开始时期,它以贝尔实验室研制成功数字的 AUDRY 系统为标志。60 年代,计算机广泛的应用于语音信号处理的研究工作中,动态规划和线性预测分析技术是这一时期的重要成果。70 年代,语音信号的研究取得了突破性进展。基于线性预测和动态时间规整技术的特定系统被研究。80、90 年代,随着计算机技术的飞速发展,语音信号的应用从研究走向实用,其研究成果已经达到相当高的水平。二十一世纪,语音信号处理技术广泛应用将使我们的生活发生巨大的变化。13 语音信号降噪的研究状况数字信号处理的意义非常
11、重大,而噪声的有效去除又可以帮助我们更好的识别所关心的有效信号对象本身,所以语音信号领域的研究近年来成为信号处理的一个热点。随着现代科学和计算机的飞速发展,语音信号处理的研究有了质的飞跃。在软件与技术方面做的已经相当成熟,而在产品研制开发上还有一定欠缺。国外虽然有一些这方第 5 页 共 39 页面的产品,但是这些产品往往不成熟,除少数应用于军工与情报领域外,大多处于实验室阶段,尚未实现产品化。即使有一些产品问世,但在实际应用中,这些产品并不能有效的降低语音信号中的噪声,提高信噪比。在国内,从事语音信号处理的研究尚处于起步阶段,但已经成为人们研究的一个热点。中科院落声学研究所、南京大学声学研究所
12、、中国科技大学等单位做了大量的工作,但是已经做成语音降噪产品的单位就很少了,据了解仅有两家公司已经有这方面的产品,一家为北京阳晨计算机有限公司,另一家为合肥升达计算机有限公司,而且他们在对语音降噪处理过程中并没有用到什么新的数字语音处理技术,也没有什么独特的方法,未取得较大的突破。也有一些人从事语音降噪方面的理论研究,他们提出了不少算法,例如非线性小波变换阀值法,小波变换模极大值法,DJ 降噪法,小波包降噪法等等。可是这些方法用在语音信号降噪方面,效果并不是很好。由于语音信号是一种周期性的随机信号,在时域上,人们对语音信号的降噪处理也往往依赖于短时傅立叶变换,以此得到语音信号与噪音的频谱特性,
13、然后设计相应的滤波器,例如带通滤波器,格型滤波器,维纳滤波器等等。这些滤波器对某些噪音的去除,有一定的效果,但是对于语音信号中的白噪音来讲,效果不是很好,所以语音处理技术还有待于发展,一些好的算法有赖于研究。14 语音信号处理的发展前景今后在语音处理中,语音编码的参数量化技术、语音的增强技术、非线性预测技术对人耳感知特性等方面有待进一步研究,语音信号中的情感信息的计算机处理研究分析也是一个新的语音信号处理研究领域。随着计算机现有软、硬件技术和传感技术等的发展以及人们日益增强的对和谐自然的人机环境的迫切要求,语音处理计算技术将得到广泛应用。语音作为人类最自然的交互方式,必将会被越来越多的研究者关
14、注。从整个语音研究的发展前景上看,语音系统的完健性将是未来几年的研究重点之一。说话人自适应技术是其中不容忽视的一个重点和难点。这项技术已经引起了越来越多的研究机构的关注和兴趣,几乎所有从事语音方面研究的科研和企事业单位都开始投入专门的精力从事自适应技术的研究。各种语音研究的国际学术会议(ICASSP,EuroSpssch,ICSLP 等)也开始把说话人自适应作为单项专题进行讨论。第 6 页 共 39 页15 论文安排本论文共分为六章,第一章系统介绍了本课题意义、语音研究的发展史、语音信号降噪的研究状况及发展前景等;第二章介绍了语音信号的基础知识;第三章介绍了语音信号常见噪声及常用的语音去噪算法
15、;第四章介绍了自适应滤波器原理及最小均方误差(LMS)算法和递归最小二乘(RLS )算法;第五章介绍了基于最小均方误差算法和递归最小二乘算法的自适应滤波器在 MATLAB 软件下的实现及简要处理分析;第六章对本次毕业设计的内容和设计体会进行了简要的总结。第 7 页 共 39 页2 语音信号的基础知识21 概述语音信号是携带语音信息的语音声波。语音声波如果经过声电转换就得到语音的电信号,如果经过声光转换就得到语音的光信号。在研究学习语音信号降噪算法之前,首先应该了解语言信号的一些基本特征,知道语音信号是如何由一些基本的单位所组成,人类的发音器官是如何产生声音的等等。在此基础上可以建立一个语音模型
16、,以便于进一步学习和处理语音信号处理的基本方法。同时,也有必要了解人类听觉的生理结构与特征。下面介绍语音处理的一些基础知识。22 语音产生机理语音是由一连串的音组成,这些音以及它们之间的相互过度就是代表信息的符号。这些音的排列是由语音的规则和发音器官决定的。人类的发音器官分为三部分:肺,喉和声道。在发声机制中,声道的作用相当于一个动力源,将气流送入喉部。喉部将来自喉部的气流调制成为周期脉冲或者类似随机噪声的激励声源,并送入声道。声道包括口腔,鼻腔和咽腔。它们对声源的频谱进行整形而产生不同音色的声音。声源还可能由声道的收缩和内壁产生,这一作用发生在声道内部,它产生一个冲击性声源。从语音产生机理的
17、解剖学和生理学意义上来说,不会产生出完美的周期性、冲激性和噪声般声源。声源经声道润色频谱后,通过嘴唇处的气压变化形成可传播的声波,被人感知为语音。可区分的语音不仅取决于声源,而且还与不同的声道形态以及它们如何与周期性、冲激性和噪声般声源相互作用有关。更确切的描述这些语音类型的单位被称为音素,该领域的研究被称为音位学(phonemics) 。某个特定类的音素在词中会表示某个特定的意思,但是同一类音素可能存在着多种声音变体而含义保持不变,研究这种声音变化的学科称为语音学(phonetics) 。音素是构成语言的基本单元,这些离散的单元依照一定的音素和方法规则或多或少的连缀成词语。23 语音特性语音
18、信号是一种非平稳的随机信号。语音的生成过程与发音器官的运动过程密切相关,考虑到人类的发声器官在发声过程中的变化速度具有一定的限度而且远小于语音信号的变化速度,因此可以假定语音信号是短时平稳的,即在 1030ms 的时间段内某些物理特性和频谱特性可以近似的看作是不变的,从而可以应用平稳随机过程的分第 8 页 共 39 页析方法来处理语音信号,并可以在语音降噪中利用短时频谱时的平稳特性。任何语言的语音都有元音和辅音两种音素。根据发生机理不同,辅音又可分为清辅音和浊辅音。从时域波形上可以看出元音和浊辅音具有明显的准周期性和较强的振幅,它们的周期所对应的频率就是基因频率;清辅音的波形类似于白噪声并具有
19、较弱的振幅,在语音降噪中可以利用浊音具有明显的准周期性来区别和抑制非语音噪声,而清辅音的特性则使其和宽带噪声区分困难。语音信号作为非平稳、非遍历随机过程的样本函数,其短时谱的统计特性在语音降噪中有着举足轻重的作用。根据中心极限定理,语音的短时谱的统计特性服从 Gauss分布,当然实际应用是只能将其看作是在有限帧长下的近似描述。24 人耳的感知特性人耳的感知特性有以下的主要特点:人耳对于声波频率高低的感觉与实际频率的高低不足线性关系,而近似为对数关系;人耳对声强的感觉很灵敏且有很大的动态范围,人耳对于频率的分辨能力受强的影响,过强或过弱的声音都会导致对频率的分辨能力降低;人耳对语音信号的幅度谱较
20、为敏感,对相位不敏感。这一点对语音信号的恢复很有帮助。共振峰对语音感知很重要,特别是前三个共振峰更为重要。人耳具有掩蔽效应,即会产生一个声音由于另一个声音的出现而导致该声音能被识别的阈值提高的现象。人耳除了可以感受声音的强音、音调、音色和空间方位外,还可以在两人以上的讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关,称为“鸡尾酒会效应” 。语音降噪的最终效果量度是人耳的主观感觉,所以在语音降噪中可以利用人耳特性来减少运算的代价。第 9 页 共 39 页3 语音信号常见噪声及常用的降噪算法31 概述语音是人类相互交
21、流和获取信息的重要方式。日常生活中,语音信号也是一种使用最多、最自然、最基本和最重要的信息载体,然而在真实应用环境中获取的语音信号往往会不同程度的受环境噪声的污染。噪声来源于实际的应用环境,因而其特性变化无穷。噪声可以是加性的,也可以是非加性的。考虑到加性噪声更普遍且易于分析问题,并且对于非加性噪声,有些可以通过变换转变为加性噪声,例如,乘积性噪声或卷积性噪声可以通过同态变换而成为加性噪声。这里我们仅讨论加性噪声。32 噪声特性加性噪声通常分为周期性噪声、冲激噪声、宽带噪声和其它语音干扰噪声等。对于周期性噪声来说,其特点市是具有许多离散的谱线。主要来源于发动机等周期性运转的机械,工频干扰。特别
22、是其谐波也会引起周期性噪声。显然,这种周期性噪声可以用梳状滤波器予以抑制,把含噪声部分得频率去掉。然而,实际环境中产生的周期性噪声并非简单的只含线谱分量,而是由许多窄谱带组成。而且,往往是时变的,并与语音信号频谱重叠,这就必须采取自适应滤波的方法才有可能自动识别和区分噪声分量。对于冲激噪声来说,其特点是表现为时域波形中突然出现的窄脉冲,主要来源于爆炸、撞击和放电等。消除这种噪声通常可以在时域内进行,其消除过程大致如下:根据带噪语音信号幅度的平均值确定阈值。当信号幅度超过这一阈值时,判别为脉冲噪声。然后对它进行适当的衰减,甚至完全消除;也可以根据相领信号样值通过内插的方法将脉冲噪声在时域上进行平
23、滑。对于宽带噪声来说,其来源较多。例如热噪声、气流(如:风、呼吸) ,量化噪声及各种随机噪声源。这种噪声可以根据其平稳及非平稳性分为白色噪声和不具有白色频谱的噪声。由于语音信号与宽带噪声在时域和频域上完全重叠,并且这种噪声只有在语音间歇期才单独存在,因此针对此类噪声,可以采用噪声消除法,谐波增强法,自适应滤波法,基于参数估计的语音再合成法以及基于短时谱估计增强算法等方法来解决。对于已知类型的噪声,可以采用适当的去噪算法进行消除。维纳和一些学者曾提第 10 页 共 39 页出了最佳滤波器,通过滤波器可以抑制噪声,提取所希望的信号。但是这些滤波器的设计都要求信号和噪声都是稳定的,并且它们的统计特性
24、都是预先可知的。而实际上这些条件很少能得到满足。然而,以自适应为原理基础的最优化语音信号噪声消除技术可以克服上述缺点。33 语音降噪的常用算法目前:语音降噪的算法主要有:滤波法的语音降噪技术、利用相关技术的语音降噪技术和非线性处理语音降噪技术等。下面我们逐一介绍这几种算法的基本原理。331 滤波法语音降噪技术(1)陷波器法对周期噪声采用陷波器是较为简便和有效的方法,它的基本思想是所设计的陷波器的幅频曲线的凹处对应周期噪声的基频和各次谐波,通过合理设计使这些频率处的陷波宽度足够窄,如图 3.1 所示。图 3.1 陷波器法语音增强结构图(2)自适应滤波器自适应滤波器最重要的特性是能有效地在未知环境中跟踪时变的输入信号,输出信号达到最优,因此可以用来构成自适应消除器。其基本原理如图 3.2 所示。信号源干扰源 We(n)参考通道主通道S+no+ N0 +-N1图 3.2 自适应滤波器带噪语音DFT 频谱整形器 IDTF增强语音