基于MATLAB的语音信号分析和处理说明书.doc

上传人:h**** 文档编号:140652 上传时间:2018-07-10 格式:DOC 页数:22 大小:254KB
下载 相关 举报
基于MATLAB的语音信号分析和处理说明书.doc_第1页
第1页 / 共22页
基于MATLAB的语音信号分析和处理说明书.doc_第2页
第2页 / 共22页
基于MATLAB的语音信号分析和处理说明书.doc_第3页
第3页 / 共22页
基于MATLAB的语音信号分析和处理说明书.doc_第4页
第4页 / 共22页
基于MATLAB的语音信号分析和处理说明书.doc_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、洗手 洗手 摘要 洗手 本文主要描述的是基于 MATLAB 的一般声音信号的频谱分析过程包括 : beef用电脑声卡录音 、 beef从 WAV 文件输入 、 beef从标准信号发生器输入 ; beef信号波形分析 , 吃饭 包括幅值 、beef频率 、 beef周期 、 beef相位的估计 , 吃饭 以及统计量峰值 、 beef均值 、 beef均方值和方差的计算 ; beef信号频谱分析 , 吃饭 频率 、 beef周期的估计 , 吃饭 图形显示幅值谱 、 beef相位谱 、 beef实频谱 、 beef虚频谱和功率谱的曲线 。 洗手 洗手 关键词 : b eefMATLAB, 吃饭 频谱

2、分析 , 吃饭 误差 洗 手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 目录 洗手 前言 1 洗手 一 、 b eef设计原理 1 洗手 1.1 系统整体设计原理 1 洗手 1.2 频谱分析原理 2 洗手 1.3 频谱图 3 洗手 1.4 模块划分 3 洗手 二 、 b eef详细设计步骤 4 洗手 2.1 语音信号的采集 4 洗手 2.2 采样分帧 5 洗手 2.3 短时能量和短时平均幅度 5 洗手 2.4 短时过零率 7 洗手 2.5 短时

3、自相关函数 8 洗手 2.6 语音信号的滤波 9 洗手 三 、 b eef设计结果及分析 10 洗手 3.1 语音信号的录入与打开 10 洗手 3.2 时域信号的 FFT 分析与加噪后的波形比较 10 洗手 3.3 滤波并比较滤波前后语音信号的波形 12 洗手 3.4 频率响应分析 14 洗手 总结 14 洗手 参考文献 15 洗手 致谢 16 洗手 附录 16 洗手 洗手 1 前言 洗手 随着软硬件技术的发展 , 吃饭 仪器的智能化与虚拟化已成为未来实验室及研究机构的发展方向 。 洗手 虚拟仪器技术的优势在于可由用户定义自己的专用仪器系统 , 吃饭 且功能灵活 , 吃饭 很容易构建 , 吃饭

4、 所以应用面极为广泛 。 洗手 基于计算机软硬件平台的虚拟仪器可代替传统的测量仪器 , 吃饭 如示波器 、 bef逻辑分析仪 、 bef信号发生器 、 bef频谱分析等 。 洗手 从发展史看 , 吃饭 电子 测量仪器经历了由模拟仪器 、 bef智能仪器到虚拟仪器 , 吃饭 由于计算机性能的飞速发展 , 吃饭 已把传统仪器远远抛到后面 , 吃饭 并给虚拟仪器生产厂家不断带来连锅端的技术更新速率 。 洗手 目前已经有许多较成熟的频谱分析软件 , 吃饭 如 SpectraLAB、beefRSAVu、 beefdBFA 等 。 洗手 洗手 MATLAB 是一个数据分析和处理功能十分强大的工程实用软件

5、, 吃饭 他的数据采集工具箱为实现数据的输入和输出提供了十分方便的函数和命令 。 洗手 本文将给出基于声卡与 MATLAB 的声音信号频谱分析的设计原理与实现方法 。 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 一 、 b eef设计原理 洗手 1.1 系统整体设计 原理 洗手 1.语音信号的采集 洗手 使用电脑的声卡设备采集一段语音信号 , 吃饭 并将其保存在电脑中 。 洗手洗手 2.语音信号的处理 洗手 2 语音信号的处理主要包括信号的提取 、 b eef信号的调整 、 beef

6、信号的变换和滤波等 。 洗手洗手 .语音信号的时域分析 洗手 语音信号是一种非平稳的时变信号 , 吃饭 它携带着各种信息 。 洗手 在语音编码 、 beef语音合成和语音增强等语音处理中无一例外需要提取语音中包含的各种信息 。 洗手 语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息 。 洗手 语音信号分析可以分为时域和变换域等处理方法 , 吃饭 其中时域分析是最简单的方法 , 吃饭 提取的特征参数主要有语音的短时能量 , 吃饭 短时平均过零率 , 吃饭 短时自相关函数等 。 洗手洗手 .语音信号的频域分析 洗手 信号的傅立叶表示在信号的分析与处理中起着重要的作用 。 洗手 因为

7、对于线性系统来说 , 吃饭 可以很方便地确定其对正弦或复指数和的响应 , 吃饭 所以傅立叶分析方法能完善地解决许多信号分析和处 理问题 。 洗手 另外 , 吃饭 傅立叶表示使信号的某些特性变得更明显 , 吃饭 因此 , 吃饭 它能更深入地说明信号的各项红物理现象 。 洗手洗手 由于语音信号是随着时间变化的 , 吃饭 通常认为 , 吃饭 语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出 。 洗手 输出频谱是声道系统频率响应与激励源频谱的乘积 。 洗手 声道系统的频率响应及激励源都是随时间变化的 。 洗手洗手 .语音信号加噪声 洗手 在 MATLAB中产生高斯白噪声非常方便 , 吃饭 我们

8、可以直接应用两个函数 : beef一个是 WGN,吃饭 另一个是 AWGN。 洗手 WGN 用于产生高斯白噪声 , 吃 饭AWGN 则用于在某一信号中加入高斯白噪声 。 洗手 也可直接用 randn 函数产生高斯分布序列 。 洗手洗手 .数字滤波器设计与滤波 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 洗手 图 1 系统整体 流程图 洗手 其中 tin 表示第 n个过零点 , 吃饭 yi 为第 i个采样点的值 , 吃饭 Fs 为采样频率 。 洗手洗手 洗手 1.2 频谱分析原理 洗手 时域分析只能反映信号的幅值随时间的变化情况 , 吃饭 除单频率分

9、量的简单波形外 ,吃饭 很难明确提示信号的频率组成和各频率分量大小 , 吃饭 而频谱分析能很 好的解决此问题 。 洗手 由于从频域能获得的主要是频率信息 , 吃饭 所以本节主要介绍频谱图的生成 。 洗手而生成的主要方法主要用到 DFT 和 FFT。 洗 手洗手 信号采集 信息采样 信号分析 信号滤波 信号变换 效果显示 3 对于给定的时域信号 y, 吃饭 可以通过 Fourier 变换得到频域信息 Y。 洗手 Y 可按下式计算 洗手 ttfyjtfyfY N N iii )2s i n ()2c o s ()( 10 101 ( 1)洗手 式中 , 吃饭 N 为样本容量 , 吃饭 t = 1/

10、Fs 为采样间隔 。 洗手 洗手 采样信号的频谱是一个连续的频谱 , 吃饭 不可能计算出所有的点的值 , 吃饭 故采用离散Fourier 变换 (DFT), 吃饭 即 洗手 1. . . ,2,1,0,)( 10 /2 NkteyfkY N Nkji i ( 2)洗手 式中 , 吃饭 f = Fs/N。 洗手 但上式的计算效率很低 , 吃饭 因为有大量的指数 (等价于三角函数 )运算 , 吃饭 故实际中多采用快速 Fourier 变换 (FFT)。 洗手 其原理即是将重复的三角函数算计的中间结果保存起来 , 吃饭 以减少重复三角函数计算带来的时间浪费 。 洗手 由于三角函数计算的重复量相当大

11、, 吃饭 故 FFT 能极大地提高运算效率 。 洗手 洗手 1.3 频谱图 洗手 为了直观地表示信号的频率特性 , 吃饭 工程上常常将 Fourier 变换的结果用图形的方式表示 , 吃饭 即频谱图 。 洗手洗手 以频率 f为横坐标 , 吃饭 |Y(f)|为纵坐标 , 吃饭 可以得到幅值谱 ; beef洗手 以频率 f为横坐标 , 吃饭 arg Y(f)为纵坐标 , 吃饭 可以得到相位谱 ; bef洗手 以频率 f为横坐标 , 吃饭 Re Y(f)为纵坐标 , 吃饭 可以得到实频谱 ; bef洗手 以频率 f为横坐标 , 吃饭 Im Y(f)为纵坐标 , 吃饭 可以得到虚频谱 。 洗手 洗手

12、根据采样定理 , 吃饭 只有频率不超过 Fs/2 的信号才能被正确采集 , 吃饭 即 Fourier 变换的结果中频率大于 Fs/2 的部 分是不正确的部分 。 洗手 即横坐标 f 0, Fs/2洗手 1.4 模块划分 洗手 模块化就是把程序划分成独立命名且可独立访问的模块 , 吃饭 每个模块完成一个子功能 , 吃饭 把这些模块集成起来构成一个整体 , 吃饭 可以完成指定的功能满足用户需求 。 洗手洗手 在模块划分时应遵循如下规则 : bef改进软件结构提高模块独立性 ; bef模块规模应该适中 ; bef深度 、 bef宽度 、 bef扇出和扇入都应适当 ; bef模块的作用域应该在控制域之

13、内 ; bef力争降低模块接口的复杂程度 ; bef设计单入口单出口的模块 ; bef模块功能应 该可以预测 。洗手 洗手 本着上述的启发式规则 , 吃饭 对软件进行如图 2 所示的模块划分 。 洗手 洗手 4 洗手 图 2 频谱分析的模块划 洗手 二 、 b eef详细设计步骤 洗手 2.1 语音信号的采集 洗手 该设计以本人的声音为分析样本 。 洗手 在 MATLAB 中使用 Wavread 函数 。 洗手 可得出声音的采样频率为 22050Hz, 吃饭 且声音是单通道的 。 洗手 利用 sound 函数 , 吃饭 可清晰地听到读音为 : beef“电子信息工程”的音频信号 。 洗手 采集

14、数据并画出波形图如下所示 , 吃饭 fs 为采样频率 , 吃饭 x为采样数据 , 吃饭 接下来对采样数据作傅里叶变换 y=fft(x)并画出频谱图如图 1所示 :洗手 0 2 4 6 8 10 12x 1 04-1- 0 . 500 . 51语音信号的时域波形时间幅值0 2 4 6 8 10 12x 1 04-1012语音信号加噪后的时域波形时间幅值洗手 图 3 原始语音信号波形及频谱图 洗手 由频谱图可清楚地看到样本声音主要以低频为主 。 洗手 人的语音信号频率一般集中在5 200 kHz到 4 5 kHz之间 , 吃饭 从声音频谱的包络来看 , 吃饭 样本声音的能量 集中在 0 1pi(1

15、 102 5Hz)以内 , 吃饭 0 4pi 以外的高频部分很少 。 洗手 所以信号宽度近似取为 1.1kHz。洗手洗手 2.2 采样分帧 洗手 这里的采样是指从语音信号中选取一段样本 , 一般取样点数为帧长的整数倍 。 洗手 每秒钟的采样样本数叫做采样频率 , 吃饭 分帧主要完成将取样模块中获得的语音样值点分为若干个语音帧 , 吃饭 语音是不平稳的时变信号 ,在时间足够短的情况下 ,可以近似认为是平稳的 ,短时分析将语音流分为一段一段来处理 , 每一段就被称为一帧 。 洗手 分帧时需对语音信号进行加窗操作 , 即用一个有限长度的窗序列截取 一段语音信号来进行分析 , 吃饭 该窗函数可以按时间

16、方向滑动 , 以便分析任一时刻附近的信号 。 洗手 常见的窗函数有 : 方窗 、 beefHamming 窗及 Hannig 窗 。 洗手 如果把窗函数理解成为某个滤波器的单位冲激响应 ,由于窗函数一般是中间大两头小的光滑函数 ,因此该滤波器具有低通特性 。 洗手 窗口长度的选择非常重要 ,窗长过短会使分析窗内没有包含足够的数据点来进行周期判断 , 且短时能量变化剧烈窗长过长 , 短时能量是一段长时间的平均 ,不但不能反映语音信号基频的细节变化部分 ,而且使得计算量增大 , 吃饭 窗口长度至少要大于基音周期的 两倍 。 洗手洗手 浊音的短时谱有两个特点 : b eef洗手 ( 1)有明显的周期

17、性起伏结构 , 吃饭 这是因为浊音的激励源为周期脉冲气流 。 洗手洗手 ( 2)频谱中明显地有凸出点 , 吃饭 即“共振峰” , 吃饭 它们的出现频率与声道的谐振频率相对应 。 洗手 清音的短时谱则没有这两个特点 。 洗手 它十分类似于一段随机噪声的频谱 。洗手洗手 2.3 短时能量和短时平均幅度 洗手 能量是语音的一个重要特性 , 吃饭 由于语音信号的能量随时间变化 , 吃饭 清音和浊音之间6 的能量差别相当显著 , 吃饭 清音的能量较小 , 吃饭 浊音的能量较大 。 洗手 因此对语音的短时能量进行分析 , 吃 饭可以描述语音的这种特征变化情况 。 洗手 短时能量 定义 为 : beef洗手

18、 n Nnmmn mnwmxmnwmxE 1 22 )()()()( ( 3)洗手 其中 , 吃饭 W( n)是窗函数 , 吃饭 N 是 窗长 。 洗手洗手 特殊地 , 吃饭 当采用矩形窗时 , 吃饭 可简化为 : beef 洗手 mn mxE )(2 ( 4)洗手 由此表明 ,窗口加权短时平均能量 En 相当于将“语音平方”信号 通过一个单位函数响应为 h( n) 的线性滤波器的输出 。 洗手洗手 本次语音信号的短时平均能量和短时平均幅度如下图 2所示 : b eef洗手 图 4 短时平均能量和短时平均幅度 洗手 由上图发现 , 吃饭 语音浊音段的短时平均能量远远大于清音段的短时平均能量 。

19、 洗手 因此 ,短时平均能量 En 的计算给出了区分清音段与浊音段的依据 ,即 En (浊 ) En (清 )。 洗手 根据 En 由高到低的跳变可定出浊音变为清音语音的时刻 , En 由低向高的跳变可定出清音变为浊音语音的时刻 , 吃饭 而只有浊音才有基音周期 ,清音的基音周期为零 。 洗手 故清浊音判断是基音检测的第一步 。 洗手 洗手 该算法中窗口选择汉明窗 ,其定义为 :洗手 其他;0 10);1/(2c o s (1 4 6.01 5 4.0)( NnNnnw (5)洗手 7 选择汉明窗的理由是窗函数的选取原则为窗函数截取后的 x ( n) 尽量是中间大两头小的光滑函数 ,冲激响应对

20、应的滤波器具有低通特性 。 洗手 从汉明窗的构成及频率响应特性上看 , 汉明窗具有这种特性 , 而矩形窗及汉宁窗则稍逊之 。 洗手 汉明窗虽然主瓣最高 (带宽大 ) ,但旁瓣最低 (通带外的衰减大 ) , 可以有效地克服泄露现象 ,具有更好的低通特 性 。 洗手 故选择汉明窗而不选择别的窗函数 ,能使短时平均能量En 更能反映语音信号的幅度变化 。 洗手洗手 短时能量函数的应用 :洗手 1)可用于区分清音段与浊音段 。 洗手 En 值大对应于浊音段 , 吃饭 En 值小对应于清音段 。洗手 洗手 2)可用于区分浊音变为清音或清音变为浊音的时间(根据 En 值的变化趋势) 。 洗手 洗手 3)对

21、高信噪比的语音信号 , 吃饭 也可以用来区分有无语音(语音信号的开始点或终止点) 。 洗手 无信号(或仅有噪声能量)时 , 吃饭 En 值很小 , 吃饭 有语音信号时 , 吃饭 能量显著增大 。 洗手 洗手 2.4 短时过零率 洗手 过零率可以反映 信号的频谱特性 。 洗手 对于连续语音信号 , 吃饭 可以考察其时域波形通过时间轴的情况 。 洗手 对于 离散时间信号 , 吃饭 如果 相邻两个样点的正负号相异时 , 吃饭 我们称之为 “ 过零 ” , 吃饭 即此时信号的时间波形穿过了零电平的横轴 。 洗手 由此可以计算过零数 , 吃饭 过零数就是样本改变符号的次数 , 吃饭 统计单位时间内样点值

22、改变符号的次数 就可以得到平均过零率 。 洗手 短时过零分析通常用在端点检测 , 吃饭 特别是用来估计清音的起始位置和结束位置 。 洗手洗手 短时平均过零率 定义为 : b eef洗手 mn mnwmxmxZ )()1(s g n s g n (6) 洗手 其中 sgn 为符号函数 , 吃饭 0)(;1 0)(;1)(s g n nx nxnx, 吃饭 在矩形窗条件下 , 吃饭 可以简化为 :洗手 n Nnmn mxmxNZ 1 )1(s g n )(s g n 2 1 (7)洗手 短时过零率可以粗略估计语音的频谱特性 。 洗手 由语音的产生模型可知 , 吃饭 发浊音时 ,吃饭 声带振动 ,

23、吃饭 尽管声道有多个共振峰 , 吃饭 但由于声门波引起了频谱的高频衰落 , 吃 饭因此浊音能量集中于 3KZ 以下 。 洗手 而清音由于声带不振动 , 吃饭 声道的某些部位阻塞气流产生类白噪声 , 吃饭 多数能量集中在较高频率上 。 洗手 高频率对应着高过零率 , 吃饭 低频率对应着低过零率 , 吃饭 那么过零率与语音的清浊音就存在着对应关系 。 洗手 .洗手 音频为“电子信息工程”的 短时过零率 的波形图如下图 3 所示 : b eef洗手 8 0 2 4 6 8 10 12x 1 04050100150200250300350帧数短时过零率短时过零率洗手 图 5 短时平均过零率 洗手 分析

24、可知 : beef清音的短时能量较低 , 吃饭 过零率高 , 吃饭 浊音的短时能量较高 , 吃饭 过零率低 。洗手 清音的过零率为 0.5 左右 , 吃饭 浊音的过零率为 0.1 左右 , 吃饭 两但者分布之 间有相互交叠的区域 , 吃饭 所以单纯依赖于平均过零率来准确判断清浊音是不可能的 , 吃饭 在实际应用中往往是采用语音的多个特征参数进行综合判决 。 洗手洗手 短时过零率的应用 : b eef洗手 1)区别清音和浊音 。 洗手 清音的过零率高 , 吃饭 浊音的过零率低 。 洗手 此外 , 吃饭 清音和浊音的两种过零分布都与高斯分布曲线比较吻合 。 洗手 洗手 2)从背景噪声中找出语音信号

25、 。 洗手 语音处理领域中的一个基本问题是 , 吃饭 如何将一串连续的语音信号进行适当的分割 , 吃饭 以确定每个单词语音的信号 , 吃饭 亦即找出每个单词的开始和终止位置 。 洗手 洗手 3)在孤立词的 语音识别中 , 吃饭 可利用能量和过零作为有话无话的鉴别 。 洗手 洗手 2.5 短时自相关函数 洗手 自相关函数用于衡量信号自身时间波形的相似性 。 洗手 清音和浊音的发声机理不同 ,吃饭 因而在波形上也存在着较大的差异 。 洗手 浊音的时间波形呈现出一定的周期性 , 吃饭 波形之间相似性较好 ; beef清音的时间波形呈现出随机噪声的特性 , 吃饭 样点间的相似性较差 。洗手 因此 , 吃饭 我们用短时自相关函数来测定语音的相似特性 。 洗手 短时自相关函数定义为 :b eef洗手 mn kmnwkmxmnwmxkR )()()()()( (8) 洗手 清音的短时自相关函数波形 和 浊音的短时自相关函数波形 如下图 4所示 : b eef洗手

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。