1、毕业设计外文翻译原文题目SPEECHCODING译文题目语音编码语音编码摘要语音编码器在通信系统中是非常重要的,因为它的性能在很大程度上决定了系统的通信能力以及还原的语音质量。所有语音编码系统的目的都是在保证允许的实现复杂度和通信时延前提下,尽量用最小的信道容量传送高质量的语音。所有的语音编码器都利用语音波形是带限的这一最基本的性质。自适应差分脉码调制利用语音信号中存在冗余信息来进行编码,是一种更加有效的编码方案。语音编码器的性能评价可分为客观评价和主观测试。关键词语音编码器;信道容量;带限;性能评价1介绍语音编码器在通信系统中是非常重要的,因为它的性能在很大程度上决定了系统的通信能力以及还原
2、的语音质量。特别是在无线通信系统中,带宽是非常宝贵的,而服务提供商时常需要解决这样的挑战用户越来越多,但是可以分配的带宽却非常有限。低比特率的语音编码提供了一种解决上面这个问题的途径。编码器给出长话质量的语音比特率越低,则能把越多的语音信道压缩到给定的带宽。正因为如此,制造商和服务提供商都在不断地开发能够提供长话质量语音的低比特率语音编码器。所有语音编码系统的目的都是在保证允许的实现复杂度和通信时延前提下,尽量用最小的信道容量传送高质量的语音。在保证某种实现复杂度和通信时延要求时,这是必须要做到的。通常,编码器的比特率和其实现的算法复杂度成正比,算法越复杂,处理的时延和实现成本也越高。所以必须
3、在这些矛盾的因素之间进行平衡,而所有的语音处理开发工作都是将平衡点着眼于低于比特率上。在语音处理中常用到的语音特性有两个语音信号在一定时间段内有近似周期性的行为,因此,可以把这些信号看作30MS的准平稳信号。语音信号的频谱有35个频率段的共振峰,这些称为共振峰的最大值是由声带共振引起的。语音编码器由于采用的信号压缩方法不同,而有很大的区别。根据所采用的压缩方法可以将语音编码器分为两大类波形编码器和声码器。波形编码器采用特定的算法对语音信号进行编码和解码,使得系统输出的波形尽可能地逼近输入波形。声码器通过提取一组参数对语音信号进行编码,然后将这组参数数字化并传送到接受机。在接收端,利用收到的信息
4、设置函数发生器和滤波器的一组参数值,进而合成语音信号输出。通常,声码器的输出波形与输入波形不相似,并且合成的语音听起来不太自然,尽管可以清楚地理解说话者所说的内容,但是很难分辨出说话者是谁。对于波形编码器(例如,PCM、DPCM、DM与CSVD,已经证明VF质量的语音信号最低能够以24KBPS的比特率进行编码。更先进的技术可以将需要的比特率降低到8KBPS,甚至以2KBPS的比特率进行语音编码也是可能的。为了获得低比特率的编码器,可以采用的技术有线性预测(在DPCM中已有讨论)、自适应子带编码器以及矢量量化。自适应子带编码器按照语音的频谱和听觉特性来分配比特数目。在矢量量化中,一次对一组样本进
5、行编码,而不是对样本逐个地进行编码。采用这种技术的例子有码激励线性预测(CELP编码以及矢量和激励线性预测编码,它们用于数字蜂窝电话系统中。这些编码器都采用基于线性预测的分析和合成LPAS技术,它们将说话者的语音信号分成20MS的段,以便进行分析和合成。接着编码器通过搜索码本激励图和滤波器参数的可能值,找出与语音分段最为匹配的合成波形。然后将规定这一最佳匹配编码器的参数以数据的方式发送到接收端。接收端利用收到的数据设置本地的语音合成器的参数,从而重建语音信号。人们力求使用更低比特率的编码器的目的是为了减小数据传输的成本。然而,更低比特率的编码器通常在计算上有更高的复杂度,从而导致系统输出端重建
6、的语音存在着更大的时延,并且语音质量更差。2语音信号的特点我们可以利用语音波形的许多性质来设计高效的编码器。其中常用的性质有语音幅度具有非均匀概率分布、相继的语音样本之间具有相关性、语音频谱的非平坦性、语音中存在浊音段和清音段,以及浊音信号的准周期性等。所有的语音编码器都利用语音波形是带限的这一最基本的性质。有限带宽意味着只要采样频率大于低通信号最高频率分量的两倍,那么对该低通信号采用一定的速率进行时间离散化(采样),就可以由其样本完全恢复重建该信号。然而语音信号的带限性质使得采样成为可能,还可以用前面提到的性质来进行量化。量化是语音编码中另一个重要的处理过程,通过量化语音编码的效率会更高。3
7、自适应差分脉码调制(ADPCM)脉码调制系统并没有去除语音信号中的冗余。自适应差分脉码调制利用语音信号中存在冗余信息来进行编码,是一种更加有效的编码方案。正如前面提到的那样,通常语音波形相邻样本间相关性很强,也就是说相邻语音样本幅度之差的方差要比语音信号幅度本身的方差小得多。采用ADPCM进行语音编码的比特率可以达到32KBPS,与PCM编码算法并形成了标准。CCITT的G721ADPCM算法标准,可用于无绳电话中提供32KBPS语音编码。在差分PCM编码方案中,编码器对一系列相邻样本的差值进行量化,而解码器则通过将已经量化的相邻样本的差值进行求和运算来恢复原始语音信号的近似值。当给定每个样本
8、的量化比特位数R时,由于量化误差的方差与输入方差成正比,量化器输入方差的减少将直接引起重建误差方差的减少。实际上,ADPCM编码器利用信号预测技术进行编码。线性预测器不是对相邻样本的差值进行编码,而是对当前样本进行预测。预测值和实际值的差值称作预测误差,ADPCM对预测误差进行编码,然后传输。预测是基于语音信号具有很强的自相关性这一性质。4语音信号的频域编码频域编码器是语音编码器的一种。它利用语音感知合成模型,而不采用前面的模型中的算法。在这种编码器中,语音信号被分解成一系列的频率成分,然后分别进行量化和编码。在这种方式中,对每一个不同子频带采用某种不同的听觉感知标准进行编码,因此,量化噪声限
9、制在子带内部,而不会在带外产生泛音失真。这种方案的优点是对每一个频率成分可以动态地分配不同的比特位数进行编码。有许多种可行的频域编码算法,有简单的也有复杂的。最常用的频域编码算法包括子带编码SBC和块变换编码。子带编码器将语音信号分成很多小的子频带,然后根据某些听觉感知标准分别对各个子频带的信号进行编码,而变换编码器则是对加窗的样本序列进行短时变换,分配的比特位数与听觉感知重要性成正比。5语音编码器的性能评价根据语音编码器保持信号质量的能力有两种性能评价方法。客观评价是通过信噪比定量地对重建语音信号与原始信号之间的差异进行评估。失真度均方误差,频域加权,分段SNR,传声清晰度指数等都属于客观评
10、估方法。客观评价在进行最初设计和系统仿真的时候非常有用,但它并不能说明人耳听到的语音效果。既然听者是最终的语音质量的判断者,因此主观听觉测试是语音编码器性能评价的一部分。主观听觉测试通过请许多人扮演听众,然后询问他们对语音质量的判断来获得。主观语音质量的评价与听者有关,将随着听者的年龄和性别、说话者的语速以及其他的因素而改变。主观测试要在不同的环境中进行,以模拟真实的生活环境,比如有噪声、多人同时说话时等,这些测试将给出听话人在不同的努力程度、不同的理解能力以及自然条件下的所有语音质量的测试结果。可懂度测试是度量听话者对口语单词的辨别能力,押韵诊断测试DRT是最流行而且应用最广泛的对理解能力的测试。在这种测试中,给测试者听一组押韵的单词中的一个,比如“THOSEDOSE”,然后让听者判断说的是哪一个词。DRT测试的正确百分率一般在75到90之间。诊断可接受度测试(DAM)是另一种评价语音编码系统可接受性的测试。这些测试结果难以进行归类,所以需要一个参考系统。最流行的等级评定系统叫做主观平均分或者MOS评分,它有五个质量等级,标准的描述是劣、次、中、良和优。参考文献(略)