浅谈web信息抽取.doc

上传人:bo****9 文档编号:6052627 上传时间:2021-08-08 格式:DOC 页数:12 大小:35KB
下载 相关 举报
浅谈web信息抽取.doc_第1页
第1页 / 共12页
浅谈web信息抽取.doc_第2页
第2页 / 共12页
浅谈web信息抽取.doc_第3页
第3页 / 共12页
浅谈web信息抽取.doc_第4页
第4页 / 共12页
浅谈web信息抽取.doc_第5页
第5页 / 共12页
点击查看更多>>
资源描述

摘要:文章阐述了web信息抽取的定义、抽取过程、Web信息抽取方法的分类,并指明了web信息抽取的应用领域和发展方向。论文关键词:web信息抽取,自然语言,包装器,web查询,抽取对象一、什么是web信息抽取Web信息抽取是指从Web页面所包含的无结构、半结构或者结构化的信息中识别用户感兴趣的数据,并将其转化为结构和语义更为清晰的格式的Web页面信息抽取的过程1。二、Web信息抽取技术涉及的内容因特网提供了一个巨大的信息源。这种信息源往往是半结构化的,并且中间夹杂着结构化和自由文本。网上的信息还是动态的,包含超链接,都以不同的形式出现。? Web信息抽取的内容一般可以分为这样几个方面:命名实体的抽取、与模板有关的内容信息抽取、各个实体之间关系的抽取和预置事件的信息抽取。信息抽取的方法主要可以分为以下两类:一类是基于层次结构的信息抽取归纳方法,另一类是基于概念模型的多记录信息抽取方法。Web信息抽取工作主要包装器(Wrapper)来完成1。包装器是一种软件过程,这个过程使用已经定义好的信息抽取规则,将网络中Web页面的信息数据

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 幼儿教育

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。