精选优质文档-倾情为你奉上第三章 一个例子使用HTK指南本章作为指南部分的最后一章,将描述构造一个简单的用于语音拨号的识别器的过程。这个识别器可以识别连续的数字串和有限个名字。由于这是一个子词译者注:并非为整个单词建立模型,而是词的一部分建立模型,可理解成对音素建模(sub-word)识别系统,所以向词典中加入一个新的名字只需要修改发音词典和语法网络(task grammar)。HMM模型使用的是连续密度混合高斯模型,且使用决策树聚类的状态绑定的triphone。虽然这个语音拨号系统本身相当简单,但是系统的设计具有代表性,对学习HTK的使用很有帮助。我们将从无到有构建此系统,包括使用HTK工具HSLab录制训练数据和测试数据。为了简化,这个系统是说话人相关的,但是建造一个说话人无关的系统可以采用相同的设计方法。唯一的不同在于需要足够数量的不同说话人的数据,以及相应地增加模型复杂度。构造一个“全新”的识别器包括很多相关的子任务,而且没有一个明确的实现这些任务的最佳顺序。这里就按时间顺序来介绍,构造类似系统时可以参考本书介绍的步骤。本书剩下的部分相当详