精选优质文档-倾情为你奉上第二章 汉语数码语音的特征提取及端点检测方法分析 2.1 语音特征参数提取2.1.1 语音特征参数:LPCC和MFCC 在语音识别系统中, 模拟的语音信号在完成A/D转换后成为数字信号, 但时域上的语音信号很难直接用于识别, 因此我们需要从语音信号中提取语音的特征,一方面可以获得语音的本质特征, 另一方面也起到数据压缩的作用。目前通用的特征提取方法是基于语音帧的,即将语音信号分为有重叠的若干帧,对每一帧提取语音特征。例如采用的语音库采样率为11kHz,因此我们采用的帧长为220个采样点(即20ms),帧步长(即每一帧语音与上一帧语音不重迭的长度)为110个采样点(即10ms)。现有语音识别系统采用的最主要的两种语音特征包括: 线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)。该特征是基于语音信号为自回归信号的假设,利用线性预测分析获得倒谱系数。LPCC参数的优点是计算量小,对元音有较好的描述能力,其缺点在于对辅音的描述能力较差,抗噪声性能较