基于asp的搜索引擎开发.doc

上传人:h**** 文档编号:138387 上传时间:2018-07-10 格式:DOC 页数:23 大小:515.50KB
下载 相关 举报
基于asp的搜索引擎开发.doc_第1页
第1页 / 共23页
基于asp的搜索引擎开发.doc_第2页
第2页 / 共23页
基于asp的搜索引擎开发.doc_第3页
第3页 / 共23页
基于asp的搜索引擎开发.doc_第4页
第4页 / 共23页
基于asp的搜索引擎开发.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、 基于 ASP的搜索引擎 的 开发 摘 要 随着互联网和宽带上网的普及, 搜索引擎 在中国异军突起 , 并日益渗透到人们的日常生活中 。 在互 联网普及之前,人们查阅资料首先想到的是拥有大量书籍资料的图书馆, 但是今天很多人都会选择一种更方便、快捷、全面、准确的查阅方式 互联网 。 而帮助我们在整个互联网上快速地查找到目标信息的就是越来越被重视的搜索引擎 。本文通过分析国内外 搜索引擎 的发展现状,提出了一种利用ASP 技术实现一个 B/S 体系结构 的搜索引擎 系统的方案,以期达到功能强大, 操作简单 ,通用性强, 可以满足用户对信息搜索需要的搜索引擎 系统。 文中着重论述了该系统的数据流程

2、 、 功能 实现 与 代码设计 、后台管理等 , 并对 相关 技术作了详细的介绍。论文在撰写过程中,力求将理论与 系统 应用相结合,对各种理论进行阐述的同 时配合系统从实际应用和操作技巧上加以说明,希望能够更充分地体现 这些知识与技术在系统中的应用与实现。 关键词 : ASP; 模糊查询 ; 关键字 ; 搜索引擎 Development of Search Engine Based on ASP Abstract With the popularization of the Internet and surfing the Net with broadband, search engine l

3、ikes a dark horse in China, and permeate through daily life day by day. Before this, when people consult materials the first thought is the library that has a large number of books .But now more and more people will choose Internet to search for information .Its more convenient, fast, comprehensive

4、and accurate for searching information. The search engine that helps us in the whole Internet to quickly identify target information is played more and more attention to. In order to achieve the formidable function, simply operating, stronger versatility and satisfy the users to the information sear

5、ch need ,This paper gives a plan that realizes a systematic scheme of search engine of B/S system structure through analyzing the current development of search engine in domestic and international systematic with the technology of ASP. This thesis mainly describes the data procedure of this system,

6、functional realization and code design, back-stage management, etc. emphatically in the article. It has done more detailed introduction to relevant technology. The paper makes every effort to use the theory and practice and combine together in the course of writing, the cooperation system is explain

7、ed from practical application and operation skill while explaining various kinds of theories, hope to more fully reflect the knowledge and application in this system of technology and realize. Key words: ASP; fuzzy query; keyword; search engine 目 录 论文总页数: 21页 1 引言 .1 1.1 课题背景 .1 1.2 搜索引擎的发展方向 .1 2 系

8、统开发技术分析 .2 2.1 系统开发环境 .2 2.2 IIS 简介 .2 2.3 SQL SERVER 2000 简介 .2 2.4 ASP 简介 .2 3 概要设计 .3 3.1 需求分析 .3 3.2 数据库设计 .3 3.2.1 分类目录数据库表 .3 3.2.2 网站登录信息数据库 .4 3.2.3 管理员数据库表 .4 3.2.4 关键字记录数据库表 .5 3.3 系统设计结构图 .5 4 系统前台模块设计 .5 4.1 网站搜索模块的实现 .5 4.1.1 功能描述 .5 4.1.2 流程图 .6 4.1.3 界面设计 .6 4.1.4 工作流程和 代码设计 .6 4.2 分类

9、目录模块的实现 .7 4.2.1 功能描述 .7 4.2.2 工作流程和代码设计 .8 4.3 网站登录模块的实现 .9 4.3.1 功能描述 .9 4.3.2 数据流程图 .9 4.3.3 工作流程 .10 4.4 网站修改模块 .11 4.4.1 功能描述 .114.4.2 工作流程图 .11 4.4.3 界面设计 .12 4.4.4 工作流程和代码设计 .13 5 系统后台 模块设计 .13 5.1 网站管理模块的实现 .13 5.1.1 功能描述 .13 5.1.2 工作流程和代码设计 .14 5.2 网站审核 .15 5.3 分类管理模块 .15 5.3.1 分类编辑 .15 5.3

10、.2 分类添加 .16 5.3.3 分类删除 .18 6 系统性能测试 .18 6.1 系统测试环境 .18 6.2 测试结果 .18 结 论 .19 参考文献 .19 致 谢 . 错误 !未定义书签。 声 明 . 错误 !未定义书签。 第 1 页 共 21 页 1 引言 1.1 课题背景 随着因特网的迅猛发展、 WEB 信息的增加,用户要在信息海洋里查找信息,就 像 大海捞针一样,搜索引擎技术恰好解决了这一难题。 目前 , 搜索引擎系统可以分类三大 类,分别是: 目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查 看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中; 机器

11、人搜索引擎:由一个称为蜘蛛的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引 ,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户; 元搜索引擎:这类搜索引擎没有自己的数据,而是将用户的查询请求同时 向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后, 作为自己的结果返回给用户。 1.2 搜索引擎的发展 方向 搜索引擎已成为一个 新的研究、开发领域。因为它要用到信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术,所以具有综合性和挑战性。又由于搜索引擎有大量的用户,有很好的经济价值,所

12、以引起了世界各国计算机科学界和信息产业界的 高度关注,目前的研究、开发十分活跃,并出现了很多值得注意的 方 向: 1.十分注意提高信息查询结果的精度,提高检索的有效性。用户在搜索引擎上进行信息查询时,并不十分关注返回结果的多少,而是看结果是否和自己的需求吻合。 2.基于智能代理的信息过滤和个性化服务。信息 智能代理是另外一种利用互联网信息的机制。它使用自动获得的领域模型(如 Web 知识、信息处理、与用户兴趣相关的信息资源、领域组织结构)、用户模型(如用户背景、兴趣、行为、风格)知识进行信息搜集、索引、过滤(包括兴趣过滤和不良信息过滤),并自动地将用户感兴趣的、对用户有用的信息提交给用户 。

13、3.采用分布式体系结构提高系统规模和性能。搜索引擎的实现可以采用集中式体系结构和分布式体系结构,两种方法各有千秋。但当系统规模到达一定程度(如网页数达到亿级)时,必然要采用某种分布式方法,以提高系统性能。 4.重视交叉语言检索 的研究和开发。交叉语言信息检索是指用户用母语提交查询,搜索引擎在多种语言的数据库中进行信息检索,返回能够回答用户问题的所有语言的文档。如果再加上机器翻译,返回结果可以用母语显示。该技术目前还处于初步研究阶段,主要的困难在于语言之间在表达方式和语义对应上的不确定性。 第 2 页 共 21 页 2 系统 开发 技术分析 通过基于 Internet 互联网的动态 WEB 数据

14、库技术,可以解决远程的数据传输与读取,远程的客户终端可以通过 WEB 页面提交请求,查询远端的数据服务器上的信息,同时还可以向远端数据服务器的数据库中存储信息以实现信息的共享,同时利用 Internet 技术可以降低软件的开发和部署成本,只要在服务器端安装 WEB 应用就可以使每个客户端都能浏览使用 。 2.1 系统开发环境 本搜索引擎系统是一个 B/S结构的系统,它的发布需要有 WEB服务器的支持,且需要数据库系统来方便的对系统数据进行存储,查询,修改,删除,及时更新系统信息,同时需要一种简单,方便的编程工具可以与数据库进行交互。鉴于上述需求我选择 IIS 5.0 SQL Server200

15、0 ASP 作为我的开发环境。 2.2 IIS 简介 系统设计 IIS 是 Internet 信息服务( Internet Information Server)的缩写,它是一种 Web 服务,主要包括 WWW 服务器、 FTP 服务器等,使得在 Intranet(局域网)或 Internet(因特网)上发布信息成了一件很容易的事。 WWW 服务提供维护网站和网页,并回复基于浏览器的请求。有了 WWW 服务和它内置的功能,通过 Internet 信息服务器可以创建各种各样的 Internet 应用程序,加上其内置的对数据库连接的支持, IIS 的功能就更强大 。 SQL 数据库信息或其他任何符

16、合ODBC 的数据库信息都能在 Internet/Intranet 上灵活应用。 2.3 SQL SERVER 2000简介 SQL Server 2000具有构成最大的 Web站点的数据存储组件所需的可伸缩性、可用性和安全功能。它支持 English Query 和 Microsoft 搜索服务等功能,在Web 应用程序中包含了用户友好的查询和强大的搜索功能。同一个数据库引擎可以在不同的平台上使用, SQL Server 2000 企业版支持联合服务器、索引视图和大型内存支持等功能,使其得以升级到最大 Web站点所需的性能级别。 SQL Server 2000 关系数据库引擎支持当今苛刻的数

17、据处理环境所需的功能, 同时将管理上千个并发修改数据库的用户的开销减到最小。 SQL Server 2000 中包括一系列管理和开发工具,这些工具可改进在多个站点上安装、部署、管理和使用 SQL Server的过程。 2.4 ASP 简介 ASP 全称为 Active Server Pages,即动态服务器页面,它是一套微软开发的服务器端脚本环境, ASP 内含于 IIS 3.0 以上版本中,通过 ASP 我们可以结合HTML 网页、 ASP 指令建立动态、交互且高效的 Web 服务器应用程序。 ASP 脚本在第 3 页 共 21 页 服务器端解释执行,结果自动生成符合 HTML 语言的主页去

18、响 应用户的请求。 ASP已成为目前应用最广泛的动态网页开发工具,同时应用 ASP 进行网络化的信息管理系统也逐步得到推广。 ASP 本身并不是一种脚本语言,它只是提供了一种使镶嵌在 HTML 页面中的脚本程序得以运行的环境。 ASP 程序其实是以扩展名为 .asp的纯文本形式存在于 Web 服务器上的,可以用任何文本编辑器打开它。 ASP 程序中可以包含纯文本、 HTML 标记以及脚本命令。用户只需将 .asp 程序放在 Web 服务器的虚拟目录下(该目录必须要有可执行权限),就可以通过 WWW 的方式访问ASP 程序了。 3 概要 设计 3.1 需求分析 随 着 互联网信息的增长,人们对信

19、息资料的查阅已不满足现有的书籍资料,网上搜索信息资料扮演着越来越重要的角色。 本系统模块设计目标是采用后台 数据 信息录入,前台动态页面 查找的方式来实现对信息的搜索。 本系统充分考虑了系统的可扩展性和 搜索引擎 特有的 查询 流程,利用 ASP 基本知识以及 Microsoft SQL Server 2000 的基本操作,使它具有良好的稳定性并且便于维护。 3.2 数据库设计 数据库结构设计 几乎所有的 WEB 项目都要基于数据库,这使得数据库的设计在整个项目中举足轻重。本 搜索 系统中大部分前台的显示信息都是从数 据库中读取所需信息,而系统管理员则只需在后台通过修改数据库中的数据即可达到改

20、变前台显示内容的目的,所以数据库在本系统中作为中间介质连接前台和后台,其重要性不言而喻。本设计根据系统需求分析,选用 SQL Server 2000 作为该系统的数据库。数据库取名为 database,其中包含了系统中所有的数据。下面对一些关键表作详细说明。 3.2.1分类目录数据库表 分类目录数据库表在数据库中标记的是 Sort 数据表,它记录的是子类信息,包括子类名称、父类 ID 和是否在首页显示。 Sort 表的具体结构如表 1所示: 表 1 sort 表 字段名称 数据类型 说明 主关键字 ID int 编号 * Sort varchar 子类名称 Sort-ID int 父类 ID

21、Show int 是否在首页显示 第 4 页 共 21 页 3.2.2 网站登录信息数据库 网站登录数据信息数据库在数据库中标记的是 Web数据表 ,它 记录的是网站名称、网站 内容 简介、网站地址、是否审核、网站关键字、联系人姓名、联系人E-mail、联系人 qq 号码、联系人地址、联系人邮政编码、网站登 录 时间、网站访问 次数、所属子类名称、子类路径和所属子类 ID。 Web 表的具体结构如 表 2所示: 表 2 web 表 字段名称 数据类型 说明 主关键字 ID int 编号 * Title varchar 网站名称 Content varchar 网站内容简介 URL varcha

22、r 网站地址 Verify char 管理员是否已经确认 Keyword varchar 网站关键字 Name varchar 联系人姓名 Email varchar 联系人 E-mail QQ varchar 联系人 qq Address varchar 联系人地址 PostCode varchar 联系人邮政编码 Time datetime 网站登录时间 Click int 网站访问次数 Sort varchar 子类名称 Sort_path varchar 子类路径 Sort_ID int 子类 ID 3.2.3 管理员数据库表 管理 员 数据表即: 数据表 Admin, 记录的是管理员

23、的 登录 名和密码。具体结构 如 表 3所示 : 表 3 Admin 表 字段名称 数据类型 说明 主关键字 ID int 编号 * UserName varchar 管理员登录名 Password varchar 管理员密码 第 5 页 共 21 页 3.2.4 关键字记录数据库表 关键字记录表即 Keyword 数据表 , 记录关键字信息,包括关键字和输入次数,具体结构如 表 4 所示 : 表 4 Keyword 表 字段名称 数据类型 说明 主关键字 ID int 编号 * keyword varchar 关键字 hot int 输入次数 3.3 系统设计结构图 系统设计 结构如图 1所

24、示: 基于ASP的搜索引擎网 站 搜 索分 类 搜 索网 站 登 录网 站 管 理管 理 员 登 录图 1 系统功能结构图 4 系统 前台模块 设计 4.1 网站搜索模块 的实 现 4.1.1 功能描述 用户访问系统时,首先接触到的是首页 面 index.asp, 它 提供了到达 5 个功能模块的超链接,默认显示为网站搜索模块。 另外 页面还提供一个表单 from,让用户输入要搜索的关键字,当用户输入关键字 单击搜索按钮后,表单中的数据将被提交到 search.asp 文件中处理。在 search.asp 首先 读取 传递过来的数据,第 6 页 共 21 页 然后判断该数据是否为空。如果不为空

25、。则将数据分割为多 个关键字,然后在数据库中查找匹配的记录,并在页面上显示。 4.1.2 流程图 在 网站搜索模块中,数据流程如图 2 所示: 图 2 网站搜索数据流程图 4.1.3 界面设计 搜索模块的界面设计如 图 3所示 : 图 3 搜索模块界面 4.1.4 工作流程和代码设计 输入关键字后,数据被提交到 search.asp 中 ,首先 使用 Request 对象的QueryString()方法 读取表单传递过来的关键字, 再判断 关键字是否为空 , 若不为空, 将多个关键字 进行处理后 分开保存在一维数组中: keyword = replace(keyword,“,“ “) 用空格替换关键词中的字符 “ 数据是否为空 搜索并显示结果 不为空 为空 关键字

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。