中文网页自动分类综述.doc

上传人:bo****9 文档编号:5989275 上传时间:2021-07-29 格式:DOC 页数:11 大小:34.50KB
下载 相关 举报
中文网页自动分类综述.doc_第1页
第1页 / 共11页
中文网页自动分类综述.doc_第2页
第2页 / 共11页
中文网页自动分类综述.doc_第3页
第3页 / 共11页
中文网页自动分类综述.doc_第4页
第4页 / 共11页
中文网页自动分类综述.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

论文摘要:本文介绍中文网页自动分类的研究状况;分析常用的特征提取方法并比较其在中文网页分类应用中的优劣,总结经典分类方法;简述分类评价指标;讨论目前分类系统。论文关键词:网页分类,特征提取,分类算法,评价指标1、引言随着网络应用的迅速普及和发展,互联网用户量急剧增长,网络上的信息资源呈爆炸式增长,面对这样海量的网络信息量,似乎能够满足人们对于信息的需求。但是实际的情况是对99%的用户来说,互联网上99%以上的信息是毫无用处的。可见对中文网页自动分类具有现实意义。2、中文网页分类的研究中文网页自动分类是从文本自动分类的基础上发展起来的,由于文本自动分类拥有比较成熟的技术,不少研究工作试图使用纯文本分类技术实现网页分类。孙建涛指出:用纯文本方式表示网页是困难的,也是不合理的,因为网页包含的信息比纯文本包含的信息要丰富得多;用不同方式表示网页然后再组合分类器的方法能够综合利用网页的特征,但各个分类器的性能难以估计,使用什么组合策略也难以确定。董静等人提出了基于网页风格、形态和内容对网页分类的网页形式分类方法,从另外的方面对网页分类进行研究;范焱等人提出一种用朴素贝

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 幼儿教育

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。