精选优质文档-倾情为你奉上基于主题的Web信息采集系统的设计与实现李盛韬,赵章界,余智华(中国科学院计算技术研究所 软件研究室,北京 )摘 要:基于主题的Web信息采集是信息检索领域内一个新兴而有实用价值的方向,也是信息处理技术中的一个研究热点。本文分析了主题Web信息采集的基本问题,提出了难点以及相关的解决方案,并在此基础上设计实现了“天达”主题Web信息采集系统。关键词: 信息采集;信息检索;信息处理;主题Email: ; ; 中图分类号:TP391 文献表示码:A基金资助:中科院计算所领域前沿青年基金资助(资助号-8 )Design and Realization of Focused Web CrawlerLI Sheng-tao,ZHAO Zhang-jie,YU Zhi-hua(Software Division, Institute of Computing Technology, Chinese Academy of Sciences, Beijing , China)Abstract: Focuse