计算机联机和光盘检索.ppt

上传人:h**** 文档编号:143384 上传时间:2018-07-10 格式:PPT 页数:48 大小:1.21MB
下载 相关 举报
计算机联机和光盘检索.ppt_第1页
第1页 / 共48页
计算机联机和光盘检索.ppt_第2页
第2页 / 共48页
计算机联机和光盘检索.ppt_第3页
第3页 / 共48页
计算机联机和光盘检索.ppt_第4页
第4页 / 共48页
计算机联机和光盘检索.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

1、第三章计算机联机和光盘检索,计算机检索原理与特点 计算机检索的组成 计算机检索的发展 计算机检索技术 计算机检索的程序,计算机信息检索的原理,计算机检索是利用计算机对各类信息资源进行存储与检索。存储过程:大量的数据按一定的格式输入到计算机中,经过计算机的加工处理,以一定的结构有序地存储在计算机的存储介质上。查找过程:用户的需求输入到计算机中,由计算机对其进行处理,并与已存储在计算机中的信息进行查询与匹配,最后按要求的格式输出检索结果。,存储,检索,规范化,计算机信息检索原理,检索标识,数据库,文献信息,检索结果,标引,情报提问,检索式,匹配运算,什么是标引?,标引:根据文献特征分析,提取检索标

2、识的过程。可以分为主题标引、分类标引、关键词标引等。 主题标引是指根据文献的主题内容,按照某种规范化主题词典或词表,给予主题词和副主题词作为检索标识; 分类标引是指根据文献的学科归属,采用某种文献资料分类法,给予分类号作为检索标识。,标引举例,乙肝发病机制分类标引:R512.62 乙型肝炎主题标引:肝炎,乙型/ 病因学关键词:乙肝,发病机制转基因作物安全性争论与事实 分类法类号: S33 农艺学 主题标引: 作物 、遗传工程 、安全性 关键词:转基因作物 ,安全,计算机信息检索的特点,检索速度快,效益高;检索功能强,数量大;检索途径多,手段灵活;检索范围广;服务方式多。,计算机信息检索系统组成

3、,硬件:运算器、控制器、存储器、输入输出装置等软件:系统操作程序、数据库管理程序、联机控制程序、应用程序等。通讯线路:电话通讯网、数据通讯网、卫星通讯网等。检索终端:信息用户与检索系统主机进行人机对话,实现联机检索的设备。包括上网设备、调制解调器等。数据库:是计算机检索的对象。是由一个或数个文档构成,并能够满足某一特定目的或某一特定数据处理系统需要的一种数据集合。,数据库(Database),一定专业范围内的信息记录及其索引的集合体,是计算机信息检索系统的重要组成部分,是信息资源,是检索对象.数据库可以分为书目数据库、数值数据库、事实数据库及全文数据库等。,书目数据库(Bibliographi

4、c Database),书目数据库存储的是二次文献,包括文献的外部特征、题录、文摘和主题词等,检索结果是所需文献的线索而非原文。图书馆的馆藏书目检索往往又称为OPAC即Online Public Access Catalogue(联机公共检索系统)许多书目数据库是印刷型文献检索工具的机读版,如:MEDLINE、CBMDISC等,数值数据库(Numeric Database),主要包含的是数字数据,如各种统计数据、科学实验数据、科学测量数据等。例如图书的尺寸和规格、药物的各种理化参数、人体生理上的各种数值,人口统计数据都可收入数值数据库。美国国立医学图书馆编制的化学物质毒性数据库RTECS,包含

5、10万多种化学物质的急、慢性毒理实验数据。,事实数据库(Fact Database),存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。如名人录、机构指南、大事记等,均可归入事实数据库。美国MEDLARS系统的医生咨询数据库(PDQ),能提供有关癌症治疗和临床实验的相关病因、诊断标准、治疗方案等信息。,全文数据库(Full Text Database),存储的是原始文献的全文,如杂志论文、报纸新闻、法院案例等。全文检索可直接获取原始资料,而不是书目检索时的线索,提高了用户的检索效率。目前我国常用的全文数据库有中国学术期刊全文数据库()、万方数据库、维普中文科技期刊数据库等全文

6、数据库。,数据库的构成,记录(Record)是构成数据库的一个完整的信息单元,每条记录描述了原始信息的外部和内部特征。书目数据库中的一条记录通常代表一篇文献,其它类型数据库中的记录则是某种信息单元,如一种治疗方案、一组理化指数等。,D923.404知识产权法:论点法规案例/刘春田主编. -北京:法律出版社,2004.1276页;23cm. -21世纪法律教育法规丛书核心课程关联导读ISBN 7-5036-4545-8:CNY24.00,比记录更小的单位是字段,是组成记录的数据项目。例如在书目数据库Medline中一条记录代表一篇文献,在这条记录中有题名(TI)、著者(AU)、来源(SO)、主题

7、词(MH)等字段。,字段(Field),文档(File),数据库中一部分记录的集合。许多大型数据库为了方便用户,常常把数据库分割成若干文档,如Medline数据库分为现期文档和若干个回溯文档。文档是数据库的结构。数据库是由一个顺排文档和若干个倒排文档所构成。,按文献记录的存取号从小到大排列。218653(AN) Nonverbal Communication in Teaching/ /Smith, Howard . Reviews of Educational Research.V49 n49 p631-72 Wtr1983 218654218655,顺排文档,倒排文档,关键词索引文档表索引

8、词 记录号 字段号Article 195895 AB2Artifacts 218653 AB22Behavior 218653 AB17Body 195895 TH2 195895 AB10,倒排文档:从数据库全部记录的基本字段中,按照著者、主题、分类等提取出所有的检索词,分别按字顺排列而重新形成的索引文档。如下图:,计算机信息检索发展阶段,脱机检索阶段(1954-1964)联机检索阶段(1965-1971)国际联机检索阶段(1972-1994)网络信息检索阶段(1995-),脱机检索(off-line retrieval),是六十年代发展起来的批次检索,用户不与检索系统发生直接联系,只需把检

9、索要求送往检索中心,由检索人员在计算机主机旁进行文献检索的一种方式。优点:价格便宜,无网络通讯费,检索费用由用户平摊,随机存储。缺点:一次机会检索,检索结果延误,委托性检索。,联机检索(on-line retrieval),联机检索是用户利用终端设备,通过通信网络或通信线路与检索系统联机,进行“人机对话”,从检索中心的数据库查找所需要的文献信息过程。特点:检索的速度快,检索结果可以得到及时修改。缺点:检索费用高,专业人员检索。,国际联机检索(international on-line retrieval),该系统是70年代出现的一门现代化情报检索手段,目前已发展到相当高的水平,计算机联机网络和

10、检索终端已遍及世界所有主要国家和地区。特点:(1)可以实现资源共享;(2)检索速度快;(3)信息资源专业化;(4)查全率和查准率较高。,世界上著名的国际联机检索系统,1.DIALOG:世界上规模最大的联机检索系统,有900多个数据库,其中广泛使用的有600多个,内容涉及多个学科领域,文献存储量超过3亿篇。2.ORBIT:提供专利、化学、能源、市场、工程和电子等方面的信息,约有100个数据库。3.BRS:内容涉及医学、生物科学、教育、健康、物理和社会科学及其它综合性学科。有150个数据库和40个私用数据库。,世界上著名的国际联机检索系统,4.OCLC:联机计算机图书馆中心,是世界上最大的为读者提

11、供文献信息机构。有60个数据库,提供会议录、工业通告、图书评论等信息。5.STN:有联邦德国、美国、日本共同合作创建的数据库,有110个数据库,多个数据库向中国免费服务。6.DIMDI:德国医学文献资料学会于1969年推出的联机检索系统。有55个数据库,侧重于提供生命科学领域资料。如:生物化学、肿瘤学、公共卫生、海洋生物学、兽医学、食品科学等。,光盘数据库检索,光盘 是80年代发展起来的激光存储载体,继纸张感光材料、磁性载体之后问世的又一种新型的信息存储介质。能存储数据、文字、图形、图像、声音、动画等各种信息。一张普通的光盘、信息存储量约为550兆。光盘的分类:按存储方式分为 (1)只读型光盘

12、:CD-ROM (2)写读光盘:WORM (3)可擦写型光盘:ERM,光盘数据库检索的类型,单机版局域网络版Web server 版,光盘检索的定义和特点,特点: (1)投资成本低; (2)价格低; (3)运行速度快; (4)检索效果好; (5)下载方便; (6)安全性能高。,光盘检索的系统组成,单机光盘检索系统组成: (1)数据库:光盘 (2)软件:系统软件和检索软件 (3)硬件:计算机、光盘驱动器、显示屏、打印机等网络光盘检索系统组成: (1)光盘塔(光盘库、磁盘阵列、镜像站) (2)光盘组网软件 (3)光盘塔服务器,计算机信息检索技术,1.布尔逻辑检索2.截词检索3.位置运算检索4.限定

13、检索,1.布尔逻辑检索,在检索过程中用于表达词于词之间的逻辑关系的算符就称为布尔逻辑运算符。分为三种逻辑关系:逻辑与、逻辑或、逻辑非;分别用AND、 OR、 NOT表示。,逻辑与(and),A AND B:检索词A和检索词B同时出现在一条记录中。其作用是缩小检索范围,提高查准率。,例如 查找韶关学院学生会有关情况资料:韶关学院and 学生会,逻辑或(or),A OR B:记录中出现检索词A或检索词B或两词同时出现在一条记录中。其作用是扩大检索范围,提高查全率,例如查图书馆利用博客开展信息服务的文章: (博客 or Blog or 网络日志)and 图书馆,逻辑非(not),A NOT B:记录

14、必须包含检索词A但不能包含检索词B。即在含有A检索词的文献中去除含有B检索词的文献。其作用是缩小检索范围,提高查准率。,例如查找有关中国地质大学(武汉)的研究生招生目录: 中国地质大学 not 北京and 研究生and 招生简章,运算顺序,布尔逻辑算符的运算次序:NOT AND OR( )号里的部分运算优先,例如查找网络信息检索方面的文献,信息检索 and (网络 not 计算机),2.截词检索,截词检索就是把检索词截断,取其中的一部分,在加上截词符号一起进行检索。主要用于检索词的单复数、词性的词尾变化、词根相同的一类词,以及同一词的拼法变异等。 通用的截词符有:?和*,截词,截词符无限截断:

15、* 或 # * 代表两个或两个以上字母有限截断:? ?代表一个字母;如:child*,可查到child, children, childish, childhood 等所有以child开头的单词。 按截断的位置不同又分为左截断、右截断和中间截断,如:?学院 左截断,3.位置运算检索,用邻近运算符连接两个检索词进行检索。它表示要求两个检索词同时出现在同一记录中,两词的相互位置必须符合规定的相邻度才能被命中检出。 邻近运算符:with (W)、nWords (nW)、near (N)、nNear (nN)等 with:连接两个词检索,词的顺序不能调换,凡是在同一记录的同一字段中出现两个词; nea

16、r:两个词在同一个句子中出现,词的顺序可以及调换。 如:CD(W)ROM library (2N) literacy,4.限定检索,字段限制限制符包括“ in, =, 、=、=1996(5)作者的限制检索:bush in au,字段限定检索举例,(6)出版类型(限制性字段)的限制检索:review in pt; pt=editorial(7)著者通讯地址检索:nanchang university in ad(8)文献标识(限制性字段)限制检索:information literacy in ab如利用维普数据库查有关企业的结构调整方面论文: TI = 企业and KY = 结构调整,字段限定

17、检索,检索步骤,1.根据课题内容,选择合适数据库,并确定检索途径;2.分析课题内容,进行概念分析,提炼出主题概念,拟出检索词,转换成系统采用的检索标识,准备若干自由词备用;3.用逻辑运算符构造提问表达式;4.进行检索,对检出文献进行相关性分析、评价;5.必要时对检索词或检索式进行修改,直至检出结果符合要求;6.查找原文。,检索实例,例1检索艾滋病治疗近十年国内外研究进展(1)分析课题内容,选择相关数据库国内:CBMdisc(1996-2006);国外:Medline(1996-2006);AIDSline(1996-2000)采用主题途径和自由词途径检索(2)提炼主题概念:艾滋病(AIDS)/

18、治疗(therapy)艾滋病又称为获得性免疫缺陷综合症(acquired immunodeficiency syndrome) (2)(3)列出检索表达式: (获得性免疫缺陷综合症 OR 艾滋病 OR AIDS)and 治疗(4)浏览检索结果,修改检索式:综述 in pt(5)重新检索(6)查找原文,中国农村劳动力向城市转移的经济与社会影响检索目的:写paper,查找参考文献学科:经济学、社会学数量:几篇即可文种:英文年代范围:1999年以后数据库: EBSCO ,Academic Research Library是否需要全文:是,中国农村劳动力向城市转移的经济与社会影响检索词China ru

19、ral or peasant?migrant or migrants or migrationsocial impact or economic impact检索技术的运用布尔逻辑 hina*(rural+peasant)截词检索 migrant#字段限制检索 impact in ti,检索结果的反馈调整,扩大检索范围的措施降低检索词的专指度,可从词表或检出文献中选择泛指词。如:公共图书馆改为图书馆调节检索式的网罗度,如删除某个不重要的检索词。 education and teen-age改为education进行族性检索,可用分类号或用OR连接一组同义词和近义词。艾滋病 OR AIDS取消某些限制过严的限制符。,检索结果的反馈调整,缩小检索范围的措施提高检索词的专指度。图书馆改为高校图书馆增加AND连接,进一步限定主题词。 如 education改为education and teen-age把检索词限定在主要字段,如标题字段、主题词字段等。 Impact in ti缩短检索年限,或限定某些刊物。,谢谢大家!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。