11 基于动态超文本的文献检索的设计与实现.doc

上传人:创****公 文档编号:851388 上传时间:2018-11-03 格式:DOC 页数:6 大小:54.50KB
下载 相关 举报
11 基于动态超文本的文献检索的设计与实现.doc_第1页
第1页 / 共6页
11 基于动态超文本的文献检索的设计与实现.doc_第2页
第2页 / 共6页
11 基于动态超文本的文献检索的设计与实现.doc_第3页
第3页 / 共6页
11 基于动态超文本的文献检索的设计与实现.doc_第4页
第4页 / 共6页
11 基于动态超文本的文献检索的设计与实现.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、11 基于动态超文本的文献检索的设计与实现卢苇 王利强(计算机科学系)摘要本文提出了一种适用于 Internet 上文献资料检索的超文本动态生成方法,并定义了一种用于表示超文本链接的图超文本链接网(HyperText Link Net,HTLN) 。关键词 超文本 文献检索 国际互联网 环球网11.1 1 引言随着国际互联网(Internet) 和环球网(World Wide Web,即 WWW)的迅速发展,全国大部分大学已建立自己的校园网,并通过中国教育科研网(Cernet)接入Internet。大部分网络用户感觉到国外的网络信息纷乱芜杂,真正有用的不多,而国内的上网资源简直少的可怜。遍览全

2、国高校提供的上网信息,介绍学校概况的居多,而真正有价值的信息则很少。鉴于目前这种状况,迫切要求各高等院校在网上提供一批有价值的高水平的文献资料,供高校师生检索和查询。只有大量有价值的信息上网,校园网和 Cernet 才能真正发挥它们的作用,为教育和科研服务。传统的手工文献检索方式,已落后于飞速发展的科技水平,远远不能满足科研和教学的需要。现代的计算机图书情报管理系统,虽然具有存储量大,检索速度快等特点,但由于它的传统的字符界面,给不熟悉计算机的用户带来很大的不便。Internet 与超文本(Hypertext) 技术的发展,为文献资料的检索和查询带来了一场新的革命。将文献数据存储到 WWW 服

3、务器上,用户利用电话线或局域网,可以很方便地访问其上的信息,由于超文本提供了简单易用的用户界面,因此普通用户很容易使用浏览工具(如 Netscape、Explore 等)进行信息的查询与检索。在 WWW 服务器上超文本的组织方式有多种,我们在这里提出了一种新型的动态超文本的存储与生成方案,并给出了程序的实现算法。11.2 2 超文本的组织在 WWW 服务器上可以按照不同的方式组织超文本,使之更有效地提供检索服务。最常用的组织方式主要有以下几种(1)、目录树方式假设有如图 1 所示的文献分类,按传统的目录树分类方式,可在计算机上组织为图 2 所示的形式。这种组织方式清晰明了,易于扩充。但由于目录

4、较多,为维护、更新带来较大的难度。用户的检索只能分级进行,不能直接对文献标题和关键词进行模糊查找。如果数据量较大,进行文献的检索则颇费周折。(2)、利用关系数据库存储可以把文献资料编辑为超文本的形式,存储到如图 3 所示的关系中。图 3 利用关系型数据库系统,很容易实现对超文本的维护和检索,但如果要动态地对超文本信息进行更新,则有一定的难度。例如有图 4 所示的超文本链接,如果有关 10Base-2 的以太网技术已经过时,则可以在关系中将有关10Base-2 的文章删去,但因为原来在多处文章中有指向 10Base-2的超文本链接,需查找出所有引用 10Base-2 的文章,将链点信息删除。利用

5、图 3 所示的关系结构则较难实现。基于以上存储方式的优点与不足,我们提出了以下超文本文自然科学数学 计算机科学 物理学图形图形技术 数据库技术 网络技术关系数据库 面向对象数据库 知识库图 1 sciencemathematics computer physicsgraph&image database networkRDB OODB KB图 2 文章编号分类号文章标题 关键词 内容(超文本方式)A0001 TP02 现代通讯技术微波通讯、红外通讯 现代通讯技术 网络技术这里你可以查询有关最新的网络技术以太网技术10Base-2 10Base-2 技术10Base-5 10Base-210Ba

6、se-T 利用细缆 快速以太网技术交换以太网技术FDDI 技术ATM 技术 图 4件组织方式。因为超文本本身是利用超链点相互指向的,可利用图的方式来表示这种链接。我们把这种图定义为超文本链接网(HyperText Link Net,简称 HTLN)。HTLN 由以下几部分组成(1)、分类集合 CC=c1, c2 c n是分类的有限集合,n=0。(2)、超文本文件集合 TT=t1, t2t m是超文本文件的有限集合, m=0。可知分类集合 C 与超文本文件集合 T 之间没有公共元素,即 CT=。(3)、分类结点的链接关系 I定义 Ici 为由 ci 指向分类结点集 I(ci)的有向边, I(ci

7、)C。(4)、超文本链接关系 O定义 Oci 为由 ci 指向超文本文件结点集 O(ci )的有向边,其中 O(ci) T;定义 Oti 为由 t i 指向分类结点集或超文本文件结点集 O(ti )的有向边,若 xO(ti)则有 (xC 且 xT)或(x C 且 xT)。我们将 HTLN 记作 H=(C, T, I, O)。则图 5 可表示为H=(C, T, I, O)C=c1, c2, c3, c4, c5, c6, c7 T=t1, t2, t3I=Ic1 Ic2 Ic3 Ic4 Ic5 Ic6 Ic7I(c1)=c2, c3, c7, I(c2)= , I(c3)=c3, c5, c6,

8、 I(c4)= , I(c5)= , I(c6)= , I(c7)= O=Oc4Ot1Ot2Ot3O(c4)=t1, t2, t3, O(t1)=t2, t3, O(t2)= , O(t3)=c6对于不同的用户,他们期望的 O(超文本文件链接关系)是不同的。这时可将 O 进一步定义为设 Ok 为用户 K 定义的 O 关系,即 Ok(ti)为用户 K 定义的由 ti 指向的分类结点或超文本文件结点。整个 HTLN 中的 O=O1 O2 Os,此时 s=0,系统共有 s 个用户。t1 c2c1 c4 t2C3c5 t3 c7 c6 图 5依据同样的方法可以对 I 进行分类。易证此时由 C 和 I

9、组成的图为一棵树。由 C、T 、I 、O 组成一个有向图。有向图的存储有多种方法。因为关系数据库的存储及检索效率较高,而且易于维护,因此我们把 C、T、I、O 分别表示成相应的关系,存储到数据库中。11.3 3 算法实现关系 T编号 关键词 kkkk(1)、查询步骤 1用户输入用户名、口令步骤 2依据当前用户名称查找关系 I,找到树的根结点,作为当前结点,返回用户步骤 3询问用户符合当前要求吗?若符合,退出步骤 4依据集合 I、O,查找当前结点的下一结点。转步骤 3(2)、增加结点或链接步骤 1用户输入用户名、口令步骤 2依据当前用户名称查找集合I,找到树的根结点,作为当前结点,返回用户步骤

10、3将结点插入此处吗?若插入转步骤 5步骤 4依据集合 I、O,查找当前结点的下一结点,转步骤 3步骤 5在集合 C 或 T 中增加新结点步骤 6在集合 I 或 O 中增加新的元素,表示新增加的链接步骤 7添加其他链接吗?若添加,则转步骤 6,否则退出关系 C编号名称C1 自然科学 关系 T编号 文献名称 内容T1 高等数学 关系 T编号 作者T1 张三 关系 I编号 ci I(ci) 用户 关系 Oc编号 ci O(ci) 用户 关系 Ot编号 ti O(ti) 用户 11.4 4 系统结构如图 6 所示,假设用户的 PC 通过电话线连接到 Web Server 上。当用户PC 上的浏览器向服

11、务器发出请求后,Web Server 识别出该请求为调用 CGI 程序,于是通过操作系统激活相应的 CGI 程序,CGI 程序根据 Web Server 传给它的参数,利用 ODBC(或其它数据库访问接口)访问相应的数据库,并将查询出的结果生成超文本返回给 Web Server,Web Server 再利用 http 协议将超文本传输到用户的 PC 上,通过浏览器显示出来。11.5 5 小结本文提出的超文本动态生成的方法不仅适用于文献资料的检索,同时可用于其它方面超文本的动态生成。以往人们设计的 Web 页面虽然美观漂亮,但需人工制作,浪费了大量的人力物力,并且不利于信息的更新。本文所提的方法

12、可以在原有文本文件的基础上(对于没有文本文件的文献资料,可利用扫描识别的方法生成文本文件),动态生成超文本。这种超文本不仅有利于信息的及时更新,而且减少了人工制作,具有很大的现实意义。特别是文件中的超链点可以依据当前用户的不同而产生不同的形式,如某个链接对用户 A 是可见的,而对(3)、超文本生成算法步骤 1生成超文本头标记如等步骤 2判断当前结点 pC 还是 pT,将关系 C 或 T 中的名称插入此处步骤 3插入超文本标记如 等步骤 4若 pT,依据关系 T 中关键词、文献内容等生成超文本的部分步骤 5检索 p 的下一级结点,提示与 p 有关的链接,如参考以下文献文献 1、文献 2 注(1)

13、、此处的超文本链接应如此定义相关文献,假设在 bin 目录下存在一个名为 RunCGI 的 CGI(Common GateWay Interface,通用网关接口)程序。有关 CGI 程序的设计参见1。(2)、结点删除的算法与结点插入的算法相似,此处略。 Netscapeh 或 Explore电话线 Web CGI ODBC Data http Server 程序 BasePC图 9于用户 B 是不可见的,而且用户还可以根据自己的需求自行建立超链点,同时又不影响他人的使用(即对他人这种链点是不可见的)。参考文献1、Rick Stout . World Wide Web Complete Ref

14、rence . McGraw-Hill2、卢开澄等. 图论及其应用. 清华大学出版社2 Designing&Inplementing of Inquiring Document Base On Dynamic HypertextLuWei WangLiQiang(Computer Science Department)Abstract: This paper presents a method of dynamic producing hypertext in inquiring document on Inertnet, and defines Hypertext Link Net(HTLN)for presenting hypertext link.KeyWords: Hypertext Inquiring-Document Internet WWW

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课程笔记

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。