软件工程毕业论文 比赛信息集成系统后台网络爬虫与信息处理比赛信息集成系统后台网络爬虫与信息处理摘要针对当前网络中对于比赛信息整合的缺乏,人们难以方便地寻找到当前某一阶段所举办的全部比赛信息的现状。为此,全力打造一个服务于在校学生和在职人员等轻松、便捷、互动地参与各类竞赛活动的竞赛门户网站迫在眉睫。因此,该系统致力于系统地收集和整理各个领域的各类赛事,为参赛者提供最优质的信息服务,使得来自全国各地的参赛选手可以相互学习可以分享心得,并且通过各种有意义的比赛不断提升自己。为了提供最全面的大学生赛事信息,比赛信息平台通过设计赛事的爬虫系统,整合所有的赛事信息,并经过筛选后呈现在用户面前。系统主要功能模块包括前台网站的实现,网络爬虫的制作,论坛的开发,后台开发与管理以及会员空间的开发与实现。系统使用了heritrix、htmlparser和java相结合的技术开发。后台使用heritrix和htmlparser技术实现比赛信息的抓取和筛选等工作,同时使用java技术录入信息,并管理前台的会员信息、论坛信息及赛事信息等,前台运用java技术js特效等实现赛事呈现、论坛运行、会员赛