自然语言理解 实验报告.doc

上传人:99****p 文档编号:1415719 上传时间:2019-02-24 格式:DOC 页数:37 大小:896KB
下载 相关 举报
自然语言理解 实验报告.doc_第1页
第1页 / 共37页
自然语言理解 实验报告.doc_第2页
第2页 / 共37页
自然语言理解 实验报告.doc_第3页
第3页 / 共37页
自然语言理解 实验报告.doc_第4页
第4页 / 共37页
自然语言理解 实验报告.doc_第5页
第5页 / 共37页
点击查看更多>>
资源描述

1、分词系统工程报告课程:自然语言理解姓名:王佳淼学号:2011914班级:信息安全 11-1日期:2013-11-2实验一 宋词字统计一研究背景本实验所涉及的研究背景是利用计算机来“鉴赏”宋词。主要针对宋词这种特殊的汉语诗歌体裁,开展了有关自动生成算法及其实现方法的探索性研究。通过对大量语料的学习,来自动生成宋词。由于宋词自身的特性,能够在经过大量预料学习后,利用在宋词当中出现频率较高的词语或者单字排列组合来生成宋词。二实验所采用的开发平台及语言工具实验在 WIN7 的环境下利用 VC+编程。三系统设计(1)算法基本思想从文本中字符,判断是否为中文字符(全角字符) ,若为全角字符则根据需要继续读

2、取,即读取两个或三个字。利用 map 容器来存储统计结果。(2)流程图(3)代码字统计#include #include #include #include using namespace std; /宋词的统计void display_map(map ofstream ofs(“c:fenciout2.txt“); int main() cout wmap; /统计双字的while (ifs)while(ifs.peek()=n) ifs.get();while(ifs.peek()= ) ifs.get();while(!ifs.peek()ifs.get(a,3, );if(a0whil

3、e(ifs.peek()=n) continue;while(ifs.peek()= ) continue;while(!ifs.peek()ifs.get(a,3, );if(a0if(str1!=“,“wmapszTemp+;if(ifs.peek()!=nifs.close();/三字ifstream ifs1(szInputFileName);while (ifs1)while(ifs1.peek()=n) ifs1.get();while(ifs1.peek()= ) ifs1.get();while(!ifs1.peek()ifs1.get(a,3, );if(a0while(if

4、s1.peek()=n) continue;while(ifs1.peek()= ) continue;while(!ifs1.peek()ifs1.get(a,3, );if(a0else continue;while(ifs1.peek()=n) continue;while(ifs1.peek()= ) continue;while(!ifs1.peek()ifs1.get(a,3, );if(a0else continue;if(str1!=“,“wmapszTemp+;if(ifs1.peek()!=nifs1.close();/单字ifstream ifs2(szInputFile

5、Name);while (ifs2)while(ifs2.peek()=n) ifs2.get();while(ifs2.peek()= ) ifs2.get();while(!ifs2.peek()ifs2.get(a,3, );if(a0if(str!=“,“wmapszTemp+;ifs2.close();display_map(wmap); return false; void display_map(map map:const_iterator map_it; for (map_it=wmap.begin(); map_it!=wmap.end();map_it+) /统计总数 su

6、m+=map_it-second; for (map_it=wmap.begin(); map_it!=wmap.end();map_it+) /计算词频 coutfirstsecondsecond/(sum-1)firstsecondsecond/sum #include #include #include using namespace std; void display_map(map void ci(int a); map wmap; map wmapp; int main() cout“开始:“endl;const char *szInputFileName=“c:Text.txt“; ifstream ifs(szInputFileName); string szTemp,szTempp;string str1,str2,str;char a10;/统计双字的while (ifs)while(ifs.peek()=n) ifs.get();while(ifs.peek()= ) ifs.get();ifs.get(a,3, );if(a0while(ifs.peek()=n) continue;while(ifs.peek()= ) continue;ifs.get(a,3, );

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 策划方案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。