第6 章 说话人识别应用VQ的说话人识别系统应用GMM的说话人识别系统概述说话人识别原理及系统结构研究展望6.1概述自动说话人识别(ASR ) 是一种自动识别说话人的过程。说话人识别是从语音中提取不同特征,然后通过判断逻辑来判定该语句的归属类别。说话人识别不注重包含在语音信号中的文字符号及其语义内容信息,而是着眼于包含在语音信号中的个人特征,以达到识别说话人的目的。因此,相比于语音识别,说话人识别相对简单。自动说话人识别按其最终完成的任务可分为两类:自动说话人确认和自动说话人辨认。自动说话人确认是确认一个人的身份,只涉及一个特定的参考模型和待识别模式之间的比较,系统只需做出“是”或“不是”的二元判决;而对于自动说话人辨认,系统则必须辨认出待识别的语音是来自待考察的 个人中的哪一个,有时还要对这 个人以外的语音做出拒绝的判断。6.1概述自动说话人识别按输入的测试语音来分,可分为三类,即与文本无关、与文本有关和文本指定型:1)与文本无关的说话人识别指的是不规定说话内容的说话人识别,即识别时不限定所用的语音内容;2)与文本有关的说话人识别指的是规定内容的说话人识别,即只能用规定内容的语句进行