盲信号语音分离技术的研究与实现——毕业论文.doc

资源描述

1、本科毕业设计(论文)论文题目盲信号语音分离技术的研究与实现 Research and Implementation of the Voice Separation Technology for Blind Signal浙江传媒学院本科毕业论文盲信号语音分离技术的研究与实现盲信号语音分离技术的研究与实现摘要：近年来语音信号的分离越来越受到大家的关注，它在助听器及便携设备、电话会议、各种语音识别方面有很多的应用和影响，且语音分离的处理方法经常在语音识别中得到实践。其中“盲”是指不知道源语音信号的分布和传输信道的参数。盲信号语音分离的理论基础是 ICA 独立分量分析，ICA 可以广泛的应用于图

2、像、通信、生物医学、声纳、地震等多种类型信号的处理中。文章首先阐述了语音信号的特征，介绍了独立分量分析的理论算法。在此基础上，对传统的自适应语音信号盲分离EASI算法进行了详细的研究，由于EASI算法采用的是固定步长，其收敛速度和分离性能不能达到最佳结合。所以，本文提出了一种基于EASI算法的改进的变步长自适应的语音信号盲分离算法，可以很好的解决收敛速度和分离性能之间的矛盾，并对其进行了算法性能仿真实验。最终通过实验结果表明，改进的自适应盲分离算法优于传统的EASI算法。关键词：盲信号处理；独立分量分析；EASI算法;变步长自适应盲分离算法浙江传媒学院本科毕业论文盲信号语音分离技术的研究与实

3、现RESEARCH AND IMPLEMENTATION OF THE VOICE SEPARATION TECHNOLOGY FOR BLIND SIGNALAbstract: Speech separation has been a hot topic in voice signal processing society recently years, which has many applications and influences in telephone conference, hearing aid, portable devices, speech recognition. T

4、he process of blind signal is a useful method in speech separation, in which the term “blind” means that the source itself and the transmission channel is unknown. Independent component analysis is the theoretical basis of blind signal separation, which can be used in various signal fields including

5、 communications, image, speech, biology, radar, seismic, sonar and etc. At first, the paper analyzes the theory and algorithm of Independent Component Analysis. On this basis, EASI algorithm was focused detail. As EASI algorithm used in a fixed step, so it does not achieve the best combination of th

6、e convergence rate and the separated performance. Therefore, an improved Variable step adaptive blind source separation based ICA algorithm was proposed. So it can improve convergence speed and reduce the maladjustment error in the steady state simultaneously. Eventually, we can find that the improv

7、ed algorithm performance is superior to EASI algorithm.Keyword: Blind Signal Processing；Independent Component Analysis；EASI Algorithm；Variable Step Adaptive Blind Source Separation Based ICA Algorithm浙江传媒学院本科毕业论文盲信号语音分离技术的研究与实现目录1 绪论 .11.1 研究背景 .11.2 国内外研究现状 .21.3 研究的目的和意义 .41.4 本文的主要内容及工作安排 .52 盲

8、信号语音分离的概要研究 .52.1 语音信号的概述 .52.1.1 语音的特性 .52.1.2 语音信号的特征 .62.2 语音分离的数学模型 .62.3 语音分离的研究内容 .72.4 语音分离的研究方法 .82.4.1 独立分量分析 .82.4.2 对源语音信号的概率密度函数进行估计 .102.4.3 目标函数的选取和优化算法 .112.4.4 语音分离的评价指标 .132.4.5 ICA 数据的预处理 .142.5 盲信号语音分离的主要流程 .162.6 本章小结 .173 盲信号语音分离的详细设计 .183.1 传统的 EASI 算法分析 .183.1.1 EASI 算法 .183.1

9、.2 算法的流程 .193.1.3 串音误差 ECT .213.1.4 算法中的步长因子 u .213.2 改进的自适应盲分离算法 .213.2.1 改进算法的分析 .223.2.2 改进的自适应盲分离算法的流程 .22浙江传媒学院本科毕业论文盲信号语音分离技术的研究与实现3.2.3 改进算法的串音误差 ECT .233.3 本章小结 .244 盲信号语音分离算法的仿真实验 .244.1 语音分离算法的实现 .244.1.1 实现平台 .244.1.2 运行环境 .254.2 盲信号语音分离的算法仿真实验 .254.2.1 EASI 算法仿真实验 .254.2.2 改进的自适应盲分离算法仿真

10、实验 .264.3 两种算法分离结果的对比分析 .284.3.1 串音误差 ECT 的比较 .284.3.2 信噪比 SNR 的比较 .294.4 本章小结 .295 总结与展望 .305.1 总结 .305.2 展望 .31致谢 .32参考文献 .33浙江传媒学院本科毕业论文盲信号语音分离技术的研究与实现第 1 页共 33 页1 绪论1.1 研究背景由于计算机技术的快速发展，社会逐步进入了数字化的时代。数字信号处理技术作为“后起之秀”很快在通信以及地震探测等多个领域得到了广泛的应用，而盲信号语音分离作为数字信号处理中的一种新兴技术是最近二十年才发展起来的。20 世纪末 21 世纪初，人类

11、生活水平明显提高，因此对于新技术的要求也显著提高。而盲信号的分离问题对于我们显得尤为重要。同时在语音通信 1、生物医学、数据挖掘模式识别和声纳探测等各个领域中，盲源分离 2的研究都具有非常重要的理论价值和实际意义。“鸡尾酒会”问题就是一个典型的盲信号语音分离的例子，它可以表述为在众多的谈话和背景噪声中，集中人们的听力于某个谈话者声音上的能力。在酒会上，我们通过多个麦克风采集到同时讲话的人的语音信号和许多噪声信号，这些信号可以称之为源信号；进而获得多路混合的语音信号，为观测信号；因为是由在不断运动的人们发出的这些语音信号，所以混合信号的信道是无法确定的，这种仅利用源信号的统计特性和观测信号恢复出

12、每个人的语音的过程就是盲信号的语音分离 1。如图 1-1 所示。源信号 s(t) 观测信号 x(t) 分离信号 y(t)图1-1 语音信号的盲分离示意图在一大堆不同的信号中，我们可以忽略其他的干扰噪声，仅仅根据自己的喜好选择出我们感兴趣的信号来接受，这是一个有趣的问题。这种特殊的辨别能力也许是由人类发声系统、听觉系统或者更为高级的知觉和语言处理的特性浙江传媒学院本科毕业论文盲信号语音分离技术的研究与实现第 2 页共 33 页所决定的，然而这些知识假设，这种机制到底是由什么决定的，还需要我们去进一步的探索。盲源分离（Blind Source Spearation，BSS）所指的是在源信号和传

13、输通道参数未知的情况下，根据源信号的统计特性，仅由观测信号恢复出源信号各个独立成分的过程 3。我们可以从盲源分离的概念中看出这里的术语“盲”有两重含义，不知道源信号是如何混合的且传输通道的参数也是未知的 4。1.2 国内外研究现状从语音分离 1的角度看，语音信号盲分离算法的研究主要经过了三个阶段。第一个阶段是盲信号语音分离理论的形成时期，这个时期的学者们致力于研究平稳的语音信号的瞬时盲分离问题。第二个阶段是上世纪九十年代中后期，大家的目光开始转移到非平稳信号的瞬时语音分离 5。第三个阶段是从本世纪初至今，学者们渐渐关注研究卷积混合模型的语音信号分离。总的来说，盲信号语音分离问题的研究内容大体上

14、可以划分为四部分：卷积混叠语音分离、瞬时线性混叠语音分离、语音分离的应用和非线性混叠语音分离 6。到目前为止，在大多数的研究中，讨论得最多的是瞬时线性混叠语音分离和卷积混叠语音分离。瞬时线性混叠语音分离代表性的算法主要有：Bell-Sejnowski的最大信息量（Infomax）方法、Amari 的自然梯度（Natural Gradient）方法、 Cardoso的等变化自适应方法（EASI ）、Hyvarinen 的快速独立元分析算法（FastICA）、矩阵特征值分解方法等。其它的语音发呢里算法大都是在以上算法的基础上推广或者补充而发展起来的，当然语音分离并不仅仅局限于这些算法。优化算法经常

15、在语音分离中被使用，就优化手法而言 2，Infomax算法、自然梯度算法、和 EASI算法属于梯度下降（上升）寻优算法，收敛速度是线性的，速度略慢一些，但属于自适应方法、具有实时在线处理能力；FastICA算法是一种快速而数值稳定的方法，采用拟牛顿算法实现寻优，没有迭代寻优过程，因此运行速度最快。相比卷积混叠语音分离和瞬时线性混叠语音分离，非线性混叠语音分离难度比较大，目前为止，只有少数学者研究非线性混叠语音分离。Taleb和 Jutten研究了非线性混叠的独立源语音信号是可分离的，他们指出普通情况下的非线性混叠语音分离 7不具备唯一解，其中后非线性（PNL，Post- nonline

16、ar）混叠具有较好的可分离性，并且针对后非线性混叠盲分离模型提出了盲分离算法。其中独立分量分析 8 (Independent Component Analysis, 简称ICA) 是研究盲源分离问题过程中出现的一种新方法。所谓ICA , 就是要寻求一种线性变换, 使信号各个分量之间高阶统计独立性最大。典型的ICA 算法有Amari 等的自然梯度算法 9 , Cardoso 等的EASI 算法等, 离线算法有Lee T. W. 等人提出的扩浙江传媒学院本科毕业论文盲信号语音分离技术的研究与实现第 3 页共 33 页展Infomax 算法 10 和Hy varinen 的Fast ICA 算

17、法 10等。本文将研究用EASI 算法解决盲信号语音分离问题。例如，2000 年，Parra 提出了基于频域去输出信号相关性的算法，不仅得到了好的分离效果，而且算法的收敛速度也非常快。总体上，这类文章可以分为两部分：卷积后混合语音信号的盲分离和瞬时混合语音信号的盲分离。盲信号语音分离用于解决瞬时线性混合问题目前已经有很成熟的算法而且也得到了很好的应用。近些年来，我国有也有很多关于盲信号语音分离技术的文章相继发表。我国也有许多的专家学者都致力于盲源分离的研究，已提出了许多的算法，这些算法大致分为几种：2002 年，苏野平等人提出一种改进的基于高阶累积量的盲信号分离算法 11并且被用来进行双路语音

18、增强，并提出了最速下降法滤波器抽头系数更新算法。模型和实际录音的实验表明所提出方法的有效性。2004 年，桂国华，蔡青，贾鹏证明了当源信号是非平稳信号是，使用二阶统计计量 12就足以成功地对混合信号进行盲分离，从而，大大简化了计算的复杂度。据此，我们提出一种基于二阶统计计量的盲分离算法，并在实验中用此算法成功地分离了语音和音乐的混合信号。2005 年，李立峰提出一种快速定点算法，该算法的特点是逐个分离出每一个源信号，并且收敛快，另外盲分离算法不仅能够在主信号方向形成主波速，并且还可以在干扰信号方向形成零点，可以大大提高信噪比。2005 年，张雪峰等 13提出对真实环境中的混叠语音信号进行盲分离

19、是一个非常困难的任务。许多在仿真信号环境下工作很有效的算法常常不能成功地分离真实环境中录取的混叠语音信号。2005 年，金辉，陈晓署提出一种实用的语音分离算法-COBliss，它是一种基于二阶统计量的多通道盲反卷积算法。但是源信号自相关函数的序列长度必须足够大，而大多数语音信号不满足这一要求。2005 年，肖俊等人在 Torkkola 提出的分析反馈分离算法 13的基础上，提出了一种在频域上用前馈结构的信息最大化算法，该算法对应于非因果 FIR 滤波器，为非最小相位系统的盲分离问题提出了一个解决方案。最后，我们将演示用这种方法分离实际环境下的两个自然信号。2005 年，何文雪等利用模糊函数的时

20、频分布特征选取时频点，提出一种新的时频域语音信号分离算法，与传统的维纳时频分布相比，不但显著缩小了时浙江传媒学院本科毕业论文盲信号语音分离技术的研究与实现第 4 页共 33 页频点的选择范围，而且不需要设定阈值。算法利用一种非正交联合对角化方法求取分离矩阵，在原始信号既有相互相关的情况下也能达到良好的分离性能。仿真实验表明，该算法难度小，分离精度高，可实现高斯源或相关源信号的盲分离。2007 年，李雪霞等 5提出了一种线性混合的混沌信号的瞬时盲信号分离方法，它利用了各个混沌信号源之间的互不相关性，在未知混合矩阵和混沌方程的情况下，通过求解特征向量的方法从观测中直接估计出解混合矩阵，以重构出

21、混沌信号。仿真结果表明，即使在低信噪比情况下，该方法仍可以有效地从噪声背景中分离出多个混合的混沌信号。2007 年，马明等采用同伦分线性模型对语音信号进行建模，将非线性可预测性作为盲源分离的准则，推到了基于同伦模型的盲源算法，成功的实现了语音信号的分离。2007 年，李大辉等给出了语音信号分离的数学模型，并确定了可分离的假设条件和分离准则，通过分析 2 种学习规则长变化对分离效果的影响，提出改进的学习规则，应用改进的学习规则实现自适应算法对语音信号的盲分离，消除步长递减过早或过晚的现象，分离效果好。1.3 研究的目的和意义在工程应用和科学研究中，许多观测信号能假设为源信号未知的混合，如：语音图

22、像信号、通信信号、雷达信号、生物医学信号、地震信号等等 2。比如，大部分生物医学信号 4都是比较微弱的非平稳信号，且容易受到噪声干扰，所以通常都是相互层叠的。提取胎儿的 ECG 信号 1,4就是从观测信号中去除母亲的心电信号和噪声信号，然后从肺信号中分离出心脏信号。在通信系统中，对于接收端来说，从发射端发出的信号是未知的，且由于“移动”的原因，信道也在不断变化 3，所以也是未知的，我们必须仅由接收信号去恢复原是信号本身。又比如在地震勘探中，震源信号和传播信道都是未知的，我们只有通过接收信号去确定地层信息。再如众所周知的经典的“鸡尾酒会”的问题 5，在一个都是客人的房间里，每一个人都能听到来自各个方向的不同种类的声音，如音乐，歌声以及人们的说话声等等。而盲信号语音分离与传统信号分离的方法最大的不同之处就在于用它可以用最少的信息得到理想的结果。总的来说，盲信号语音分离是一种仅仅利用观测到的混合信号来估计源信号的方法，它是以独立分量分析（Independent Component Analysis，ICA） 3为理论基础的。随着数字信号处理理论和技术的发展以及相关学科的不断深入，许多盲信号分离算法被不断提出，使盲信号分离问题逐渐成为当今信息处理领域中最热门的研究课题之一。而我们所要研究的盲信号语音分离技术虽然不可

展开阅读全文