1,第九讲 中文姓名识别,詹卫东http:/ 概率法猜测中文姓名,例子: 她的名字是叫谭柳华吧,1 从右向左取出词串(直到非单字词为止): 是 叫 谭 柳 华 吧,2 在上述单字词串(碎片)中寻找可能是中文姓名的部分: 是 叫 谭 柳 华 吧,把“谭柳”加入候选姓名,把“谭柳华”加入候选姓名,把“柳华”加入候选姓名,把“柳华吧”加入候选姓名,4,得到四个候选姓名:谭柳(-10.3450) 谭柳华(- 16.2774) 柳华(- 9.4401) 柳华吧(- 6.8817),5,产生输出串 : 是 叫 谭柳华 吧,先处理姓名左边的词串:,是/,叫/,poffset = 4,6,继续处理剩余的“碎片: 她 的,“她 的” 费用: 14.2829 不是姓名,因此,作为单字词输出,得到最后结果:,是/,叫/,谭柳华/,吧/,名字/,的/,她/,7,课后练习,改进例子程序,使得可以识别数字在例子程序中增加跟踪功能,将分析过程中的全部侯选词及其费用输出到一个文件中。,