中文信息处理基础.ppt

上传人:ga****84 文档编号:454137 上传时间:2018-10-08 格式:PPT 页数:7 大小:87.50KB
下载 相关 举报
中文信息处理基础.ppt_第1页
第1页 / 共7页
中文信息处理基础.ppt_第2页
第2页 / 共7页
中文信息处理基础.ppt_第3页
第3页 / 共7页
中文信息处理基础.ppt_第4页
第4页 / 共7页
中文信息处理基础.ppt_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1,第九讲 中文姓名识别,詹卫东http:/ 概率法猜测中文姓名,例子: 她的名字是叫谭柳华吧,1 从右向左取出词串(直到非单字词为止): 是 叫 谭 柳 华 吧,2 在上述单字词串(碎片)中寻找可能是中文姓名的部分: 是 叫 谭 柳 华 吧,把“谭柳”加入候选姓名,把“谭柳华”加入候选姓名,把“柳华”加入候选姓名,把“柳华吧”加入候选姓名,4,得到四个候选姓名:谭柳(-10.3450) 谭柳华(- 16.2774) 柳华(- 9.4401) 柳华吧(- 6.8817),5,产生输出串 : 是 叫 谭柳华 吧,先处理姓名左边的词串:,是/,叫/,poffset = 4,6,继续处理剩余的“碎片: 她 的,“她 的” 费用: 14.2829 不是姓名,因此,作为单字词输出,得到最后结果:,是/,叫/,谭柳华/,吧/,名字/,的/,她/,7,课后练习,改进例子程序,使得可以识别数字在例子程序中增加跟踪功能,将分析过程中的全部侯选词及其费用输出到一个文件中。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。