1、理工大学学士学位论文I摘要确定一个声源在空间中的位置是一项有广阔应用前景的有趣研究,将来可以广泛的应用于社会生产、生活的各个方面。声源定位估计算法研究是声源定位技术中的重点内容。而基于声传感器的声源定位技术能够对拾取的带噪声信号进行有效的空域滤波和消噪处理,在一定程度上改善声源定位系统的性能。声源定位是通过测量物体发出的声音对物体定位,与使用声纳、雷达、无线通讯的定位方法不同,前者信源是普通的声音,是宽带信号,而后者信源是窄带信号。根据声音信号特点,人们提出了不同的声源定位算法,但由于信号质量、噪声和混响的存在,使得现有声源定位算法的定位精度较低。此外,已有的声源定位方法的运算量较大,难以实时
2、处理。为解决这些问题,本文系统地研究了基于传声器阵列的声源定位方法,主要做了以下一些工作首先对传声器阵列及其研究现状进行了总体概述,讨论了基于传声器阵列的声源定位所面临的问题,重点分析了传声器阵列信号处理的特殊性和混响的产生原因及影响。其次总结归纳并比较了各种基于传声器阵列声源定位方法的优缺点。最后重点分析了基于时延估计(ITD)和强度差异IID的声源定位方法。关键词传声器阵列;声源定位;ITD;IID;MATLAB理工大学学士学位论文IIABSTRACTIDENTIFYASOUNDSOURCELOCATIONINSPACEISANINTERESTINGRESEARCH,HASABROADAP
3、PLICATIONPROSPECTINTHEFUTURECANBEWIDELYUSEDINALLASPECTSOFTHESOCIALPRODUCTIONANDLIFESOUNDSOURCELOCALIZATIONESTIMATIONALGORITHMRESEARCHISTHEKEYCONTENTINSOUNDSOURCELOCALIZATIONTECHNOLOGYANDOFSOUNDSOURCELOCALIZATIONBASEDONACOUSTICSENSORTECHNOLOGYTOBEABLETOPICKUPTHEBELTNOISESIGNALSPATIALFILTERINGANDDENOI
4、SINGPROCESSING,EFFECTIVELYIMPROVESTHEPERFORMANCEOFTHEBEAMFORMERSYSTEMTOSOMEEXTENTBEAMFORMERISDETERMINEDBYMEASURINGTHESOUNDCOMINGFROMANOBJECTTOLOCATEOBJECTS,ANDTHEUSEOFSONAR,RADAR,WIRELESSPOSITIONINGMETHODISDIFFERENT,THEFORMERSOURCEISNORMALVOICE,BROADBANDSIGNALS,WHILETHELATTERSOURCEISANARROWBANDSIGNA
5、LACCORDINGTOCHARACTERISTICSOFVOICESIGNAL,PEOPLEPUTFORWARDDIFFERENTSOUNDSOURCELOCALIZATIONALGORITHM,BUTBECAUSEOFSIGNALQUALITY,NOISEANDREVERBERATION,MAKEEXISTINGPOSITIONINGACCURACYOFSOUNDSOURCELOCALIZATIONALGORITHMISLOWINADDITION,THEEXISTINGSOUNDSOURCELOCALIZATIONMETHODCOMPUTATIONALCOSTISLARGER,HARDTO
6、REALTIMEPROCESSINGTOSOLVETHESEPROBLEMS,THISPAPERSYSTEMATICALLYSTUDIEDTHEMETHODOFSOUNDSOURCELOCALIZATIONBASEDONMICROPHONEARRAY,MAINLYDONETHEFOLLOWINGWORKFIRSTLY,THEMICROPHONEARRAYANDITSRESEARCHPRESENTSITUATIONHASCARRIEDONTHEOVERALLOVERVIEW,DISCUSSEDTHEPROBLEMOFSOUNDSOURCELOCALIZATIONBASEDONMICROPHONE
7、ARRAY,ANDFOCUSESONANALYZINGTHEPARTICULARITYOFMICROPHONEARRAYSIGNALPROCESSINGANDREVERBERATIONOFCAUSESANDEFFECTSTHESECOND,SUMSUPANDCOMPARESTHEADVANTAGESANDDISADVANTAGESOFVARIOUSKINDSOFSOUNDSOURCELOCALIZATIONBASEDONMICROPHONEARRAYMETHODFINALLYANALYZEDBASEDONTIMEDELAYESTIMATIONITDANDINTENSITYDIFFERENCEI
8、IDOFTHESOUNDSOURCELOCATINGMETHODKEYWORDSMICROPHONEARRAYSOUNDSOURCELOCALIZATIONITDIIDMATLAB理工大学学士学位论文III目录1绪论111研究背景和意义112声源定位技术概述及国内外研究现状213基于传声器阵列的声源定位系统的模型与难点314本文的主要工作和内容安排52几种定位方法的介绍621声音信号分析622声源定位方法的分类和比较6221基于最大输出功率的可控波束的声源定位6222基于高分辨率谱估计的声源定位7223基于时延估计的声源定位8224定位方法比较923常用处理方法及分析10231经典波束形成器法
9、10232最小均方自适应滤波器法103基于时延(ITD)的方位估计1231传感器概述和声源的几何模型12311双传声器几何模型与分析12312传感器的特性与选择1432几何定位方法1633信息的采集与处理17331数据采集方法17332声音信号的处理18333声源到传声器间距离差的计算18334声源位置的计算与仿真1934程序测试与误差分析214基于强度差异(IID)的方位估计2441方法概述与分析24理工大学学士学位论文IV42声源方位估计的实现25421数据的采集25422声压幅比的计算方法26423声源位置的计算与仿真2743程序测试与误差分析28结论31致谢32参考文献33附录A英文原
10、文34附录B汉语翻译38附录C源代码40理工大学学士学位论文11绪论11研究背景和意义声源定位多年来一直作为国内外研究的重点课题,被引起广泛的关注。声源定位起初主要应用在军事方面,如水下潜艇定位,直升机定位,雷达探测定位,导弹飞行定位等。而如今,随着信息社会的发展和科技水平的进步,声源定位技术逐渐发展成熟,不仅在军事领域,而且在科学研究、日常生活中都得到了进一步的应用。目前,声源定位技术在水下目标定位、地震探测和非金属材料的无损检测中具有重要的实用价值,在视频会议、可视电话、监控系统、助听装置、鲁棒语音识别等领域都有着广泛的应用。在声源定位中,对声信号的获取、转换、显示和处理是定位系统的重要组
11、成部分,也是进行定位的基础性环节。而在这个环节中,通过传感器、中间变换器等一些设备来接受声信号而导致声电转换后的信号包含有丰富的信息内容,同时也在系统外部和内部各种因素的影响下必然在输出的信号中夹杂着很多不需要的成分,这就要求我们应尽量剔除混杂在信号中的噪声和干扰,削弱信号中的多余内容,将有用信号强化、突出,以利于分析计算,尽量将信号变换成符合要求的形式,而传感器是承担获取信号的任务的重要器件,因此它也是整个定位系统的关键部分。在无干扰噪声、混响的情况下,距离声源很近的高灵敏度、高精确度和频率响应的传感器能够获得高质量的声源信号。但是,这要求声源和传感器之间的位置相对固定。若声源相对传感器运动
12、或位于选择方向之外,就会引入大量的噪声,导致参数估计的精确度下降。此时可以使用多个传感器,对信号进行一定的处理而达到相应的要求,这些传感器通过测量声源定位算法中所需信号的相应参数,确定出声源位置。二维平面中,普遍采用的算法即测量到达两个传感器间时延,确定一对以这两个传感器节点为焦点的双曲线,三个节点可形成两对双曲线,双曲线的交点即为声源位置。而在实际应用中,大多数情况是在的近场环境下进行的,由于阵列的空域滤波方法的差异及误差的存在,并且技术还有待完善,因此对声源定位问题的研究具有很强的理论价值和实践意义。理工大学学士学位论文212声源定位技术概述及国内外研究现状20世纪80年代以来,传感器阵列
13、信号处理技术得到迅猛的发展,并在雷达、声纳及通信中得到广泛的应用。这种阵列信号处理的思想后来应用到语音信号处理中。在1985年FLANAGAN将传声器阵列引入到大型会议的语音增强应用中,开发出多种实际产品。之后,SILVERMAN和BRANDSTEIN将其应用于语音识别和声源定位中。进入90年代以来,基于传声器阵列的语音处理算法正逐渐成为一新的研究热点。基于传声器阵列的产品能够广泛利用于具有复杂背景的语音通信环境,例如会场、多媒体教室、车载免提电话和助听器等。目前国外从事传声器阵列相关研究的机构主要有INTEL、宝利通、东芝等。但是国内并没有类似的具有自主知识产权的产品,所以对于该技术的研究具
14、有较为领先的意义。出现较早,并且在实际中应用的传感器阵列的信号处理方法是波束形成法1,在这种方法中,基阵的输出是各个阵元输出的简单的加权求和,通过调整权系数可以在希望的方向上形成波束,而对其余的方向产生较小的响应。然后对整个观测空间做波束扫描即可确定信号的方位。但是,基阵的分辨率受瑞利准则的限制,是这种方法自身无法解决的问题。时延估计的理论和技术是由水声目标定位及信号处理发展脱颖而出的。现代声纳的研究始于20世纪初,到第二次世界大战时,各种声纳装置己经被广泛地用于水中兵器。自20世纪五十年代以来,随着信息论、信号检测理论和计算机技术的飞速发展,以及各个应用领域对时延估计的需求,时延估计理论得到
15、了迅速的发展。进入上个世纪九十年代以来,除了对以往的方法进行扩展和深入研究以外,又发展了基于人工神经网络的时延估计方法,基于谱相关理论的时延估计方法和各种自适应时延估计方法等。新世纪以来,随着超大规模集成电路技术的广泛使用,人们将传感器与测量系统电路制作在同一块硅片上,得到体积小、性能好、功能强的集成传感器,使传感器的信号处理功能大大提升,相应产品被广泛使用于具有复杂背景的通信环由走动。近半个世纪以来,随着军事装备需求、集成电路规模和制造工艺水平的发展,作为信号处理方向的一个重要分支,基于传感器的信号处理技术得到了人们空前的关注,其有关的理论和技术也越来越成熟。与常规波束形成法比较,改善后的这
16、些高分辨算法都在一定程度上增强了基阵的分辨率,但这些处理方法有一个相同的问题,即对相干源的处理。声源定位是通过测量发声体的物理特性对物体进行定位。实际中,根据对目标的定位方理工大学学士学位论文3式不同可分为有源和无源定位两种。有源定位是系统主动发射并接收返回信号,由信号的往返时间延迟差别来判断出估计目标的速度、距离或位置等参量,以此完成系统定位的方式。例如,声纳和雷达就是采用有源定位方式进行工作的。它们的工作原理是主动发出电磁波对估计目标进行搜索,当发射信号遇到目标后,其中一部分信号返回相应的设备处理系统并对信息进行算法分析,从而对被测物体进行定位。有源定位系统具有高精度、全天候等特点,但这种
17、定位系统常常是靠发射大功率信号来实现,较容易受到外部环境的影响。相对而言,无源定位不主动发射探测信号,而是凭借对估计目标发出信号的采集处理来进行目标定位。其原理是将设备采集到的定位参数信息,如信号声场信息等,通过处理运算而确定出估计目标的方位或距离参量来完成系统定位。无源定位的特点是一般很少存在系统干扰,具有较高的隐蔽性和安全性。但由于系统不发射电磁信号,所以必须要通过探测由估计目标发射出的信号或经一定区域反射回的信号才能够进行系统定位,否则不能定位。利用传感器等设备对目标发出的声音信号进行拾取,并使用现代信号处理技术对其进行分析处理,以此来判断目标的空间方位,是目前研究声源定位系统确定目标位
18、置的关键技术。目前,国际上一些大公司如西门子、宝利通、东芝等早已成立了专门用于研究定位技术的一些部门。相比之下,国内对此方面的研究还不是很多,在声源定位方面的很多方法也仅能够提供仿真结果支持。13基于传声器阵列的声源定位系统的模型与难点在深入研究声源二维定位的实际应用时,可以知道系统有很多拟要解决的关键问题,要保证系统的高精度和实时性,还有很多难点需要处理,如下第一,严格意义上,声源的存在形式是空间三维的,但考虑到实际研究中,三维空间的背景环境和算法复杂度,又根据数学知识,三维空间可以看成是无数个二维平面的累积,即可以把其划分成对无数个二维平面的积分。对二维平面定位的研究也就是声源(空间)定位
19、的基础,故本实验的研究重点是在二维平面中进行。第二,在声源定位系统中,单个传感器只能显示在某一时刻有声源信号发射,并不能确定声源的位置信息,而系统为提供足够的参量对声源的定位就要求多传感器协调工作。声源定位系统的定位性能与声传感器摆放的位置有很大关系,由于环境噪声及传感器性能等因素的影响,声源在远场或近场,同侧或异侧的定位效果是不同的,合理地安理工大学学士学位论文4排调整传感器的布局,才能使系统的定位性能提高到一定标准。第三,声源发射的声信号一般是非平稳信号。在窄带信号条件下,各个传感器之间相位差可近似看成是发射信号源的位置函数,频率是一常量;而在宽带非调制信号条件下,各个传感器之间相位差是声
20、信号源位置和频率的复合函数。又考虑到实验环境中存在一定的信号反射与混响,信号与噪声或噪声与噪声之间可能是相关的,信号在频域和时域互相叠加,此时需采用时频联合的方法进行处理,对不同方向的信号进行目标估计,而传统的分析方法如傅立叶变换无法对其进行时域分析。为了说明基于传声器阵列的声源定位系统的模型与难点,图11详细描绘了一个传声器阵列声源定位应用的实际情况。由图11可知,传声器阵列系统定位声源的精度受多方面因素的影响。第一是噪声和反射的噪声;第二是声源的多重反射(即混响);第三是声源与传声器的相对位置。图11传声器阵列声源定位系统描述假定声音传播满足线性波动方程,且周围环境在一段时间内不变,则从声
21、源到传声器之间可看成线性时不变系统。可设声源信号为SN,第I个传声器接收到的信号为XIN,若噪声为高斯白噪声,则XINHINSININ11其中HIN是周围环境的脉冲冲激响应,IN是高斯白噪声。一个高精度声源定位系统所面临的难点主要有(1)由于声音的反射,传声器不仅收到声音信号的直接到达部分,还收到反射部分。而声音的反射会导致互相关函数或者波束的尖峰扩展,使得难以确定最大值,从而加大了定位的误差。(2)定位系统不仅受到噪声的干扰,而且由于噪声的反射,会产生相关噪声。这理工大学学士学位论文5样各传声器间噪声的互相关函数就不等于零,从而增大了定位的难度。(3)传声器位置的摆放。对于一个定位系统而言,
22、传声器的数量越多,传声器的相对位置越多样化,提供的空间信息量越大,从而具有较高的定位精度。而在实际系统中,传声器的摆放位置比较固定,数量也比较少。因此难点就是在尽量少的传声器和固定摆放位置条件下,提供高的定位精度。14本文的主要工作和内容安排实现一个可仿真的二维声源定位系统是本论文的目的。在算法研究比较充分的基础上,设计系统结构,实现声源定位。本文对传声器阵列声源定位系统进行了系统的研究,主要工作如下(1)介绍了几种声源定位方法,总结归纳了各种基于传声器阵列的定位方法的优缺点。(2)重点研究了时延估计方法,讨论了各种时延估计方法的优缺点。归纳比较了各种基于时延的方位估计方法。(3)设计并实现了
23、可仿真的声源定位系统。详细介绍了系统结构,给出了实验结果,详细分析了各种影响因素对系统定位精度的影响,并给出了改进方案。本论文的各章主要内容安排如下第一章,介绍了系统的应用背景和研究现状。第二章,分析了声源定位原理和几种声源定位方法。第三章,给出了基于时间差(ITD)的声源定位设计,详细介绍了传声器的选择与布局、算法的实现过程及软件系统的设计和实现过程,并对存在的问题进行讨论。第四章,给出了基于声压差(IID)的声源定位设计,详细介绍了算法的改动及软件系统的设计和实现过程,并对存在的问题进行讨论。第五章,总结了本论文所完成的工作,分析了其中的长处和不足,并提出了对后续研究工作的建议。理工大学学
24、士学位论文62几种定位方法的介绍21声音信号分析声源体发生振动会引起四周空气振荡,那种振荡方式就是声波。声波借助空气向四面八方传播。在开阔空间的空气中那种传播方式像逐渐被吹大的肥皂泡,是一种球形的阵面波。除了空气,水、金属、木头等也都能够传递声波,它们都是声波的良好介质。在真空状态中声波就不能传播了。声音在不同的介质中的传播速度不同。声音的速度受温度影响,温度越高,速度越快。在15时,声音在空气中的传播速度为340M/S,25时为346M/S。它和温度的关系可以用以下公式来表示C33145061TM/S21在使用时,如果温度变化不大,则可认为声速是基本不变的。声波传输距离首先和大气的吸收性有关
25、,其次是温度、湿度、气压等。22声源定位方法的分类和比较声源定位技术就是利用相关设备、方法对声源进行位置、距离或速度等一些参数进行确定。常用的声源定位技术主要有以下几类基于最大输出功率的可控波束的声源定位、基于高分辨率谱估计的声源定位、基于时延估计的声源定位和基于波达方向估计的声源定位。根据不同的应用要求,有以下五种声源定位原理。221基于最大输出功率的可控波束的声源定位基于最大输出功率的可控波束的声源定位方法通过使各个传感器阵元采集得到的信号时间移位进而来补偿声源到达不同传感器阵元之间的时延量。将补偿后获得的信号再相加,求其均值即为传感器系统(阵列)的输出。而此时,各路传感器的阵元信号中,存
26、在与对应目标声源的信号成分同相的部分则相加,其他方位的信号则会导致阵列输出在该方位上存在不同程度的衰减,这样就可以通过对各路信号进行加权求和并调控权值找出使传感器的输出信号功率最大值处,在该系统满足最大似然准则的条件下,以搜索声源的估计位置的方式来形成波束,并使得波束对准声源点以获得此最大信号输出功理工大学学士学位论文7率,确定出阵列最大输出方向就是该声源的方向,以此来实现声源的位置定位。现如今,基于声传感器的可控波束形成定位技术在语音拾取领域有较多的应用,但定位系统若要对声源的定位达到一定的可靠性还比较困难,主要是因为这种方法的算法运算量很大且需要对全局进行搜索,较难实时实现。而为减少算法的
27、运算量使用一些迭代方法处理时,常会出现计算结果仅收敛于几个局部最大值的情况,从而无法计算出系统有效的全局峰值影响系统定位,并且基于最大输出功率的可控波束的定位对初始的搜索值和声源发射信号的频谱特性较为敏感,就会使其绝大多数的最优化准则都是要求于对背景噪声和声源频谱特性的先验知识的前提下。所以,可知该类方法在实际的应用中系统的性能差异较大且运算复杂,不适合实时定位系统,这就使得该类方法的应用范围受到了一定的影响。222基于高分辨率谱估计的声源定位基于高分辨谱估计的声源定位方法是通过接收声源的发射信号相关矩阵的空间谱信息,以声源和噪声子空间的正交性为基本要求,使用阵列自相关矩阵中主特征向量的主分量
28、或噪声子空间的特征向量值,对各个声传感器间的相关矩阵求解并进行相关的谱估计,找到目标的方向角并确定出声源的估计位置坐标。实际应用中,常常通过使用时间均值来确定谱估计中信号之间的相关矩阵特性,但这种方法必须以声源信号是参数固定不变的平稳信号为前提条件,而在通常情况下声源发出的信号仅是一个短时平稳信号,所以现实中往往不能够满足该条件。与可控波束形成技术定位法相比,该定位法的性能和可靠性较低,而算法的迭代运算量的复杂程度也相对较低。此外,在定位过程中需要先假定具有相同特性的多个声传感器和一个理想声源,这在实际环境中较难做到。该定位技术的效果对混响的影响较大且要求各个传感器置于窄带信号的远场条件,而声
29、源产生的信号是宽带信号。目前,对空间谱估计的绝大多数研究方法是针对于远场窄带信号情况,即处理的接收信号具有较高的中心频率且信号的最高频率与最低频率之间的差值相对较小,也就是信号的分数带宽小于001。此时,传感器的各个阵元之间的接收信号可近似看成是单频信号,时域参量可通过相移来补偿。而现有的一些宽带信号处理技术是在分数带宽为001至10的范围内进行的,但在目前多数的声源定位处理中,接收信号没有经过相应的调制,其相位差就会由声源的特性来决定。传感器可以接收的信号范围是低频率100HZ左右,高频4000HZ左右,少数甚至可达到16KHZ,这时的分数带宽接近20,此时不能用相移来补偿由时域参量引起的随
30、频率差异出现的相位差。理工大学学士学位论文8所以,使用现有的一些窄(宽)带的信号处理方法,很难去解决实际中的声源定位问题。223基于时延估计的声源定位人对声源的定位主要用到了声音幅度这个物理量,而机器却可以精确的测量声音的相位。由于声波在空气中以一定速度传播,到达设置于不同位置的传声器的相位不同,根据这些传声器对同一声音采集时的相位差别,我们可以计算出同一声音到达每对传声器的时间差值(又叫时延值)。图21是到达时间差T的示意图。如果我们得到了某个声源发出的声音到达一对传声器的时延值,则这个声源就处于以这对传声器所处的位置为焦点,到达时延所对应的声音传输距离为参数的双曲面上。使用多对传声器得到多
31、个时延值,也就得到了多个双曲面,声源位置就处于这些双曲面的相交点。合适的安排传声器的位置,可以使得双曲面的交点只有一个,这点就是我们要的声源位置。大多数声源定位是基于时延的方法,提高对时延估计的准确程度是这种方法的关键,而要得到准确的时延估计必须要确保有高效的信号采集能力。图21到达时间差T的示意图基于时延估计的声源定位方法是通过对三个或三个以上的传感器采集的信号进行处理,获得相应的时延参量信息并建立相应几何模型进行计算,从而根据声源信号到达各个传感器的时间不同确定出目标声源的估计位置坐标,实现声源定位过程。例如,在二维平面中,声源发出的信号经两个不同传感器的测量而得到的时间差,确定的是一条经
32、过此声源点并以此两个传感器为焦点的双曲线,利用三传感器形成的两对时延信息确定的两条双曲线产生的交点,再由一些测量信息排除虚假点,从而就能确定出声源的位置。所以,时延定位技术又可称作双曲线定位,它是利用建立数学模型来计算的一种简单有效的声源定位方法。如今,该定位方法在智能导航、声纳探测等领域的应用较为广泛。系统设备首先对声源到达各个传感器之间相对时延进行估计,然后利用这些估计时理工大学学士学位论文9延,确定出声源的估计位置,实现系统的声源定位过程。但在时延定位方法中,声源发出信号后,声传感器采集端的信号的测量及处理的能力对系统定位的精度起着决定性的影响,因此,对提高时延定位精度方面的研究是测量系
33、统需要解决的重要内容。为了处理传感器对声源信号测量得到的带噪信号,常用广义互相关估计、最小均方估计等使定位的误差尽可能的降低为最小,也可用不需要迭代的球面相交法、球面求补法和平面相交法等,这些方法都可直接求得目标声源的估计位置,使系统获得较高的定位精度。与现有的一些声源定位技术相比,基于时延估计的定位方法具有较高的定位性能,运算量不大,硬件设备要求不高,可在实际中低成本实现。但是该定位方法需要通过两个步骤来进行,即时延估计和定位计算,这就可能会导致由时延估计过程中存在的混响噪声、反射量化等因素引起的误差,通过算法的运行传递给下一步,从而影响了整个定位系统的精确度,另外,该方法在对单声源定位时可
34、获得较好的定位效果,而当环境中存在有多个声源时,对其定位的结果可能会存在较大的偏差。224定位方法比较在这三种定位方法中,基于最大输出功率的可控波束形成技术是出现较早且已在实际中应用的一种定位方法,较多的用于雷达、声呐以及移动通信的信号处理中。可控波束形成技术本质上是一种最大似然估计,它需要声源和环境噪声的先验知识。而实际使用中,这种先验知识往往很难获得。基于高分辨率谱估计的定位方法是通过时间平均来估计信号之间的相关矩阵,需要信号是平稳过程,估计参数固定不变,而声音信号是一个短时平稳过程,往往不能满足这个条件。该定位方法的效果和稳定性不如可控波束形成法,但每次迭代的计算复杂度不像可控波束形成那
35、么苛刻。此外还须假定理想的信号源和相同特性的传声器等,在实际环境中不可能做到这点。基于时延估计的定位方法在运算量上远远小于可控波束和谱估计法,可以考虑在实际中实时实现。但是该方法也有不足之处。其一,估计时延和估计方位分成两阶段来完成,因此在定位阶段用的参数已经是对过去时间的估计,这在某种意义上只是对声源位置的次最优估计;其二,时延定位的方法比较适合于单声源的定位,而对多声源的定位就束手无策;其三,在有较强反射和噪声的情况下,往往很难获得精确的时延,从而导致第二步的定位产生很大的误差。虽然如此,但由于时延估计定位方法的运算量比较低,而且在适当改进后,在一定理工大学学士学位论文10的噪声和反射下有
36、比较好的定位精度,因此适合于在实际中实时应用。23常用处理方法及分析231经典波束形成器法经典波束形成器法,又称延迟相加法或傅里叶法,它是利用电子引导的方式将波束调整至任意角度,以寻找阵列的最大输出功率方向。图22给出了波束形成器的基本结构,而输出信号YK为传感器阵列各个阵元输出的线性加权和,即有图22经典波束形成器的结构在经典波束形成算法中,形成波束的会在测量的扇形区域进行有规则地离散扫描,测量不同的波束形成器权值W情况下的不同输出功率。而其波束方向与输出功率的关系可由式22推导得出PWRWARA22因此,对输入的自相关矩阵R进行估计,就能够通过校准来计算出所有可能区域内的引导向量并获得输出
37、功率关于波达角度之间的函数。232最小均方自适应滤波器法最小均方自适应滤波器法是以信号的期望响应和经滤波器处理输出的信号之间误差最小均方值为准则,对输入的迭代信号进行梯度矢量估计,更新函数的权系数以达到最优准则的自适应算法,它的原理框图如图23所示理工大学学士学位论文11图23自适应滤波器原理图其中,自适应滤波器的输入、输出信号值分别为XK和YK,信号期望的响应值或参考信号值为DK,误差信号为EK,系统的滤波参数会根据误差信号EK的不同而自动调整变化,使下一次经输入信号XK1产生的输出量YK1更接近于考信号值DK1。若在最速下降法迭代过程中,获得每步梯度N的确定值并选择合适的收敛因子,则最速下
38、降法收敛于最佳维纳解。为保证对梯度矢量每一步测量估计的准确性,就需要获得该系统的自相关矩阵和互相关矩阵的先验知识。最小均方自适应滤波器法通过一定的误差准则调整,在收敛的情况下给出相应估计值,对时变信号进行处理并根据信号的统计特性来自动调节滤波器的函数系数,实现对信号的处理。但这种算法实现起来硬件要求较高且环境的实时处理能力较差,收敛函数和矢量噪声等因素对系统的性能影响较大,仅适合于权系数的选取恰当、环境变化平稳、传感器间距小的情况下,另外,此算法对周期信号的处理效果不佳且运算量也相对复杂,所以,在实际中很少使用此方法对有一定周期性的信号进行处理。理工大学学士学位论文123基于时延(ITD)的方
39、位估计本章详细讨论了如何根据估计的时延值来确定声源的方位并进行仿真,定位的方法为几何定位法,首先分析了传声器和声源的几何模型,然后根据几何方法,实现定位算法以及对样本数据的采集,最后通过编写MATLAB程序对算法进行仿真。31传感器概述和声源的几何模型传感器是一种获取信息的装置。它的定义为“能感受规定的被测量并按照一定的规律转换成可用信号的器件或装置,通常由敏感元件和转换元件组成”,也可以理解为借助于检测元件接受一种形式的信息,并按一定的规律将所获取的信息转换成另一种信息的装置。按照这个定义,传感器获取的信息,可以是各种物理量、化学量或生物量的信息,而转换后的信息也可以是各种形式。但在大部分情
40、况下,传感器转换后的信息为电信号。因而从现在的实际应用情况上,传感器的定义可以写成为,把外界输入的非电信号转换成电信号的装置。在本课题中,我们将在众多的传感器中选择并改进一种传感器,使其在一定混响和噪声存在的条件下,能够对获取的声信号进行调整和处理,使输出后的电信号继续输送给后续的测量定位装置,以达到对声源二维定位算法的研究。在建立传声器和声源的几何模型的过程中,首先建立双传声器几何模型,然后建立传声器阵列几何模型,并做出详细的分析。311双传声器几何模型与分析在声源定位的研究过程中,双传声器只能确定声源在以一定角度为顶角的双曲面上,不能确定声源的具体位置。所以,想要探测出声源的位置,必须摆放
41、两组甚至多组传声器,从而组成传声器阵列。同时,定位的准确程度也取决于传声器的数量,在经过一定位置的摆放后,传声器的数量越多定位的精度也就越高。图31就是一种由四个传声器组成的典型传声器摆放方法。理工大学学士学位论文13图31四个传声器的定位摆放示意图可见,定位系统的成功与否与传声器的摆放有很大关系,传声器的数量会影响定位的精确程度。在本模型中,声源和传声器的坐标位置如图32所示图32声源和传声器的坐标位置假设第I对传声器M1和M2连线的中点为原点,它们的连线为X轴,声源到这两个传声器间的时间差是。用矢量和表示这两个传声器的位置,用矢量表示声源的位置,则声源S应该满足矢量方程(31)其中C为声速
42、。由双曲面的定义可得,满足该方程的S必落在双曲面上。在图中所示的声源是极坐标形式,将声源坐标和传声器坐标转化为直角坐标形式,可得(32)理工大学学士学位论文14(33)34)将式(32)、(33)、(34)代入式31,两边平方可得(35)当声源离传声器比较远时即R变得很大时,趋近于零,式35可以近似为(36)所以当已知传声器间的时延和传声器间的距离时,可以近似求得图31中的角。也就是说,当声源离传声器比较远时,可以用以为方向角的圆锥面来近似代替声源可能的位置。此近似如下图33。图33声源的双曲面和锥面近似图因此只要求得时延(时间差),就能近似求得声源相对于两传声器连线中点的方向角。312传感器
43、的特性与选择在理想状态下,传感器应该具有单值的、确定的输出输入关系,而这主要取决于传感器的动态特性和静态特性。静态特性是指传感器在被测量处于稳定状态时,输出量和输入量之间的关系。动态特性是指传感器的输出量对于随时间变化的输入量的响应特理工大学学士学位论文15性。故传感器应在其输出电量无论是在静态量或动态量输入时,都应当不失真地体现输入量的变化。下面给出实际应中,传感器常用的几个特征量。(1)灵敏度传感器的灵敏度是指在其相对稳定工作的状态下输出变化量与输入变化量之间的比值。对于线性传感器,其灵敏度是它的校准曲线的斜率,为一个常数。而非线性传感器的灵敏度为一个变量,其灵敏度可以用KDY/DX来表示
44、,也可以用某一小区域内的拟合直线的斜率表示。(2)线性度在规定的条件下,传感器校准曲线与拟合直线间最大偏差与满量程输出量的百分比称为线性度。在实际工作中,常用一条拟合直线去近似地代表实际的特性曲线。线性度可以用如下公式表示。37其中,YMAX为校准曲线与拟合直线间的最大偏差,YFS为传感器满量程输出,即有YFSYMAXYMIN。(3)分辨力分辨力是指传感器在规定的测量范围内能够检测出被测量的最小变化量的能力。它受到噪声的限制,通常用相当于噪声电平N若干倍C的被测量表示,即有MCN/K38式中,M为最小检测量,C为系数一般取15倍,K为灵敏度。(4)精度精度分为准确度、精密度和精确度。所谓准确度
45、是指测量值与真值的偏离程度;而精密度是指即使测量相同的对象,每次测量值也不相同,它说明了测量结果的分散性;精确度是在简单场合下可取准确度和精密度两者的代数和,通常以测量误差的相对值来表示。基于以上这些参数条件,可知对于传感器元件的选取应根据需要选择最适宜的传感器,从系统总体考虑,由测量参数(信号的测量时间、要求精度、信号的频率等)和实验室中的环境场所并兼顾结构简单、体积小、性价比高的原则,本实验中,选取的传感器为驻极体电容式传感器。驻极体电容式传感器是贝尔实验室在1962年发明的麦克风式的传感器,主要是由能够提供专用场效应管和极化电压的电容传感器极头的驻极体材理工大学学士学位论文16料所组成。
46、驻极体材料是一种化学的材料,是在高温高压下被注入能够永久性的存储电荷的一种材料。驻极体材料的膜片与金属板之间可以看成是一个电容,当声音引起膜片振动时,膜片与金属板之间的电容就会变化,就会产生随声音变化的变容电压,但这个电容量在低频段的输出阻抗很大,所以,需要在材料与放大电路之间加上一个阻抗变换器,可利用其输入阻抗高和输出阻抗低的特性,在声电变换中把其作为接口电路使用,其结构图如下所示。图34阻抗变换器结构示意图32几何定位方法本文使用七个传声器组成的传声器阵列来实现声源定位的仿真,传声器的分布如图35所示。其中,假定声源S的坐标为(X0,Y0,Z0),传声器M2摆放在原点位置,其坐标为(0,0
47、,0);M1和M3摆放在X轴上,坐标为(A,0,0)和(A,0,0);M4和M5摆放在Y轴上,坐标为(0,A,0)和(0,A,0);M6和M7摆放在Z轴上,坐标为(0,0,A)和(0,0,A),声源S到各传声器的距离分别为D1,D2,D3,D4,D5,D6,D7(图中只标示了D1,D2,D3)。可见,七个传声器覆盖了整个三维空间,等距的分布在原点、X轴、Y轴和Z轴上,这样的布局方式,一方面严密而一致,可以充分的接收声源信号;另一方面呈几何对称关系的各传声器的摆放,减少了很大部分的运算量,更高效的实现了对各个量之间的关系求解过程。理工大学学士学位论文17图35七个传声器的定位摆放示意图33信息的
48、采集与处理对于传感器所输出的电信号,一般情况下不能够直接输送到显示、记录或处理系统中去。其主要原因有以下几点(1)大部分传感器输出的电信号会比较微弱,需要进一步放大后才能进行下一步处理。(2)有些传感器输出的是电参量,需要变换为电能量进行处理。(3)输出的信号中混杂干扰和噪声,需要尽量去除噪声,提高信噪比。(4)对需求的输出信号的处理只是作用于部分频段的信号,则要从输出中分离出相应所需频率成分。(5)传感器输出的是数字(模拟)信号,需要把其变换成模拟(数字)信号才能进行处理。因此,基于以上原因,在传感器的输出端,信号要经过适当的变换,才能使输出信号与后续的处理环节相适应。331数据采集方法将传
49、声器M1,M3,M4,M5,M6,M7放置于以M2为原点的直角坐标系中,两两分布在X,Y,Z轴上,与原点M2的距离为A,A可以根据实际需要取值。声源发出的声音信号以不同的时间传达至各传声器,由于声速C一定,所以根据传声器阵列所获得理工大学学士学位论文18的时间差可以计算出声源至各传声器的距离差。将采集得到的数据以数组的形式保存,继而进行下一步的运算与分析。但是,由于本文只涉及到用计算机实现定位仿真,所以必须预先假定声源坐标,通过对假定坐标的运算得到声源S到各传声器间的距离差,此距离差将作为“已知的测量值”进行接下来的定位仿真,其过程举例如下传声器至原点的间距A20,声源S坐标X050,Y0200,Z060,即S(50,200,60)。332声音信号的处理对声音信号的处理过程分为三个环节,首先通过几何方法计算声源到各传声器间的距离差,然后通过已得的距离差对声源位置进行计算,最后通过MATLAB编程实现声源定位的仿真。333声源到传声器间距离差的计算根据两点间距离公式,声源S到M1的距离可表示为D1(39)同理,声源S到M2的距离可表示为D2(310)所以得声源到M1和M2的距离差D12(311)在MATLAB程序编写时,可以使用CUMSUM函数实现D12的运算。以此类推,可以得到声源S到各传声器的距离差D23,D24,D52,D13,D62,D27。但是,由于