1、1语音信号处理实验讲义时间:2011-122目录实验一 语音信号生成模型分析.3实验二 语音信号时域特征分析.7实验三 语音信号频域特征分析12实验四 语音信号的同态处理和倒谱分析163实验一 语音信号生成模型分析一、实验目的1、了解语音信号的生成机理,了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。2、编程实现声门激励波函数波形及频谱,与理论值进行比较。3、编程实现已知语音信号的语谱图,区分浊音信号和清音信号在语谱图上的差别。二、实验原理语音生成系统包含三部分:由声门产生的激励函数 、由声道产生的调制函数()Gz和由嘴唇产生的辐射函数 。语音生成系统的传递函数由这三个函
2、数级联而成,()Vz()Rz即 ()()HVz1、激励模型发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。经仪器测试它类似于斜三角波的脉冲。也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。单个斜三角波的频谱表现出一个低通滤波器的特性。可以把它表示成z变换的全极点形式 12()cTGzez这里c是一个常数,T是脉冲持续时间。周期的三角波脉冲还得跟单位脉冲串的z变换相乘: 112()()()vcTAUzEzez这就是整个激励模型, 是一个幅值因子。vA2、声道模型当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,把它称为
3、共振峰。一个二阶谐振器的传输函数可以写成 12()iiAVzBCz实践表明,用前3个共振峰代表一个元音足够了。对于较复杂的辅音或鼻音共振峰要到5个以上。多个 叠加可以得到声道的共振峰模型()iz 01211 1()() RrMiri Nki kbzAVzBzCa3、辐射模型4从声道模型输出的是速度波,而语音信号是声压波。二者倒比称为辐射阻抗,它表征了口唇的辐射效应,可用下式表示: 10()Rzz三、实验内容1、设声门脉冲单个三角波的数学表达式为 111122cos 0()() 0 nNgnn其 他试画出三角波波形图及其频谱。取 。12=53N,参考程序:%三角波及其频谱n=linspace(0
4、,25,125);g=zeros(1,length(n);i=0;for i=0:40if n(i+1)=5g(i+1)=0.5*(1-cos(n(i+1)*pi/5);elseg(i+1)=cos(n(i+1)-5)*pi/8);endendfigure(1)subplot(1,2,1)plot(n,g)xlabel(时间/ms)ylabel(幅度)axis(0,25,-0.4,1.2)r=fft(g,1024);r1=abs(r);yuanlai=20*log10(r1);signal(1:512)=yuanlai(1:512);pinlv=(0:1:511)*8000/1024;subp
5、lot(1,2,2)plot(pinlv,signal);xlabel(频率/Hz)5ylabel(幅度/dB)axis(0,620,0,30)图1-1 三角波及其频谱2、给出语音段“数字信号处理”(speech.wav),画出它的语谱图。clear all;x,sr=wavread(speech_dsp.wav);s=length(x);w=round(44*sr/1000);n=w;shift=w/2;h=w-shift;%win=hanning(n);win=hamming(n);c=1;ncols=1+fix(s-n)/h);d=zeros(1+n/2),ncols);for b=0:
6、h:(s-n)u=win.*x(b+1):(b+n);t=fft(u);d(:,c)=t(1:(1+n/2);c=c+1;endtt=0:h:(s-n)/sr;ff=0:(n-2)*sr/n;imagesc(tt,ff/1000,20*log10(abs(d);colormap(gray);axis xyxlabel(时间/s)6ylabel(频率/kHz)图1-2 语谱图四、思考题1、声门激励脉冲信号是高频衰减的还是高频增强的?2、画语谱图时为什么要给语音信号加汉明窗?若加矩形窗会有什么区别?3、在语谱图上观察,浊音信号的和清音信号的频谱有什么区别?7实验二 语音信号时域特征分析一、实验目的
7、1、了解自相关函数及自相关函数在语音信号处理中的应用。2、编写程序分析语音信号的短时自相关特征,计算语音信号的基音周期。3、编写修正短时自相关函数的程序,并与未修正的函数进行比较。二、实验原理自相关函数用于衡量信号自身时间波形的相似性。由前面的讨论可知,清音和浊音的发声机理不同,因而在波形上也存在着较大的差异。浊音的时间波形呈现出一定的周期性,波形之间相似性较好;清音的时间波形呈现出随机噪声的特性,杂乱无章,样点间的相似性较差,这样,可以用短时自相关函数来测定语音的相似特性。时域离散确定信号的自相关函数定义为: ()()mRkxk对于语音信号来说,采用短时分析方法,可以定义短时自相关函数为 (
8、)()()nmkxwnxknm因为 ,所以()nnR()()()nnmkRxkwnk定义 ,则上式可以写成()khw()()()n kmkxhn如果长基音周期用窄的窗,将得不到预期的基音周期;但是如果短的基音周期用长的窗,自相关函数将对多个基因周期做平均计算,从而模糊语音的短时特性,这是不希望的。为了解决这个问题,可以采用修正的短时自相关函数,选择的窗长不一定要等于自相关函数的最大自变量取值。这种方法可以采用较窄的窗,同时避免了短时自相关函数随k增加而衰减的不足。三、实验内容1、根据给出的浊音信号,分别画出浊音信号的时域波形、加矩形窗和加汉明窗后计算短时自相关归一化后的结果。语音的抽样频率为8
9、kHz,窗长为320。参考程序:x,fs,nbits=wavread(speech_dsp.wav);s1=x(2500:2819);N=320;8A=;for k=1:320sum=0;for m=1:N-k+1sum=sum+s1(m)*s1(m+k-1);endA(k)=sumendfor k=1:320A1(k)=A(k)/A(1);endf=zeros(1,320);n=1,j=1;while j=320f(1,j)=s1(n)*0.54-0.46*cos(2*pi*n/319);j=j+1;n=n+1;endB=;for k=1:320sum=0;for m=1:N-k+1sum=
10、sum+s1(m)*s1(m+k-1);endB(k)=sumendfor k=1:320B1(k)=B(k)/B(1);end%画图s2=s1/max(s1);figure(1)subplot(3,1,1)plot(s2)title(一帧语音信号);xlabel(样点数);ylabel(幅度);axis(0,320,-1,1);subplot(3,1,2)plot(A1)9title(加矩形窗的自相关函数)xlabel(延时k)ylabel(自相关函数R(k)axis(0,320,-1,1);subplot(3,1,3)plot(B1)title(加汉明窗的自相关函数)xlabel(延时k)
11、ylabel(自相关函数R(k)axis(0,320,-1,1);图2-1 浊音信号加不同窗时的自相关函数2、仍选取上题中的语音信号,改变窗长和截取语音段的长度,计算修正的短时自相关函数。取值分别为:(1)N=320,M=640;(2)N=160,M=320;(3)N=70,M=140;x,fs,nbits=wavread(speech_dsp.wav);s1=x(2500:3139);b=s1;%窗长640,自相关运算取320个点。b1=b(1:640);N=320;10A=;for k=1:320sum=0;for m=1:Nsum=sum+b1(m)*b1(m+k-1);endA(k)=
12、sum;endfor k=1:320A1(k)=A(k)/A(1);end%画图figure(1)subplot(3,1,1)plot(A1);xlabel(延时k)ylabel(R(k)legend(N=320)axis(0,320,-0.5,1)%窗长320,自相关运算取160个点。b2=b(1:320);N=160;A=;for k=1:160sum=0;for m=1:Nsum=sum+b2(m)*b2(m+k-1);endB(k)=sum;endfor k=1:160B1(k)=B(k)/B(1);end%画图figure(1)subplot(3,1,2)plot(B1);xlabel(延时k)ylabel(R(k)legend(N=160)axis(0,320,-0.5,1)%窗长140,自相关运算取70个点。