1、第一章 绪论 1. 文献检索(information retrieval)是指收集整理文献并按一定方式组织和存储,同时根据用户的信息需求查找出相关信息的过程,又称为“文献存储与检索” 。狭义的文献检索是指根据用户信息需求,利用检索工具或检索系统从文献信息集合里找出用户所需文献的过程。2. 文献检索语言 是根据文献检索需要而人工规范的语言系统,用来描述文献特征和表达信息检索提问的一种专用语言,供信息标引以及文献检索时使用。3. 文献 指以文字、图像、公式、声频、视频、代码等手段将信息、知识记录或描述在一定的物质载体上,并能起到存贮和传播信息情报和知识作用的一切载体。三个基本要素:内容上的知识或信
2、息;揭示和表达知识信息的标识符号;记录信息符号的物质载体。4. 信息素养又称为信息素质,是伴随着社会信息化的形成和发展而出现的一个名词术语,指具有检索、分析、评价和利用各种信息源以解决信息需求及制定明智决策的能力,是对个人信息行为能力、独立学习能力以及批判性思维能力等概括性描述。第二章 医学文献信息资源1. 按文献内容的加工深度和内容性质划分 一次文献、 二次文献、 三次文献、 零次文献 (1)零次文献 零次文献指未经正式发表或未进入正式交流的最原始的文献。(2)一次文献 是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文
3、等。(3)二次文献 是将大量无序分散的一次文献收集、整理、加工、著录其特征(如著者、篇名、分类、主题、出处等) ,并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。因其具有检索功能而称为检索工具或检索系统。 (4)三次文献 是科技人员围绕某一专题,借助二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。表现形式主要有:综述(Review) 、述评(Comment) 、进展(Progress、 Advance) 、现状( Update) 、发展趋势( Trend)等期刊文献、百科全书、年鉴、手
4、册等参考工具书。 2. 其中中图法具有比较突出的优点,已为大多数图书馆所取用。3. 图书馆目录 目录是著录一批相关文献,并按照一定次序排列而成的一种揭示与报道文献的工具。4. 查找馆藏图书的方法一般有两种,一种是直接进开架书库或阅览室到书架上查找,另一种方法是先利用馆藏目录查到要找图书的索书号,再根据索书号到书库中索取。5. 参考工具书类型 参考工具书:是根据一定需要以特定的编排形式和检索方法,为人们迅速提供某方面的基本知识或资料线索,专供查阅的特定类型的图书。 特点具有知识性、资料性、检索性。 按编辑体例与功用分:字典、词典、年鉴、手册、类书、政书、百科全书、表谱、图录、名录等。 按内容分有
5、综合性的、专科性的; 6. 馆际互借馆际互借(interlibrary loan,简称 ILL)是图书馆之间相互利用对方馆藏来满足本馆读者需求的一种资源共享服务。馆际互借一般针对图书,是一种返还式文献资源共享方式,是图书馆根据读者需求,将本馆没有收藏的图书,从其他收藏馆借阅过来提供读者使用的一种服务。 文献传递是在馆际互借基础上发展起来的,是馆际互借的一种,是非返还式的文献资源共享方式。7. 科技查新概念 新颖性8. 查新在科研项目创新性鉴证方面的作用有两方面:在立项阶段、在成果申报和鉴定阶段9. 学科服务由图书馆学科馆员来推动,通过电话、邮件、研究室、课题组等方式,将图书馆信息服务延伸到用户
6、之中。10. 数字图书馆是以现代信息技术为依托,以分布式海量数字化信息资源库为基础,不受地理位置和时空限制,以求最大限度地满足用户个性化需求的虚拟图书馆。第三章 医学文献信息检索基础 1. 数据库的类型按收录信息内容的类型不同划分1.文献型数据库(书目型和全文型)2.数值型数据库3.事实型数据库4.图像数据库5.多媒体数据库 2. 数据库的结构 从用户的角度看,数据库主要由文档、记录和字段三个层次构成。数据库通常由若干个文档(file)组成,每个文档又由若干条记录(record)组成,每条记录则包含若干字段(field) 。 从数据库组成的方式来划分:顺排文档和倒排文档3. 文献数据库的检索途
7、径 检索系统主要依信息的各项特征来编排,形成不同的检索途径。检索途径是检索系统提供的检索入口。常用的检索途径:主题词途径、关键词途径、分类途径、题名途径、著者途径,等。 4. 检索语言(retrieval language)又称文献存储与检索语言、标引语言等,是信息检索系统存储与检索过程中共同使用的一种专用语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 5. 检索语言的类型 检 索 语 言 描 述 文 献 外 部 特 征 描 述 文 献 内 容 特 征 题 名 著 者 专 利 号 、 档 案 号 等 分 类 号 主 题 语 言 分 类 语 言 关 键 词 叙 词 单
8、 元 词 标 题 词 非控 语 言 受 控 语 言 6. 医学主题词 (Medical Subject Headings,简称 MeSH)是 NLM 编制的世界医学领域最权威、最常用的一部规范化的、可扩充的动态叙词表。7. 医学主题词MeSH 词的种类(1)叙词(descriptor):又称主题词(subject heading) (2)款目词(entry term ):又称入口词 (3)限定词(qualifier):又称副主题词(subheading)(4)特征词(check tag):在主题词字段检索主题词(main headings) 又称叙词( Descriptors) ,是用于描述主
9、题事物或内容的规范化词汇。 主题词的形式 主题词的树状结构号 主题词的单一性 主题词的动态性 限定词又称副主题词,是限定主题概念的一类规范化词汇,对主题词起细分作用以及揭示多个主题词之间的关系。限定词的数量及其可组配的主题词的范围均有严格规定。目前,MeSH 表规定使用的限定词有 83 个 款目词又称入口词,是主题词的同义词或近义词,作用是将自由词引见到主题词。8. 文献检索方法1.检索工具法(常用法) 利用检索工具查找所需信息2.浏览法 定期或不定期浏览最近出版的期刊、专著等了解最新信息3.引文追踪法 从现有文献出发,以其参考文献 为线索查找相关文献 4.综合法/循环法 联合运用上述方法获取
10、文献 9. 布尔运算符AND、OR、NOT,分别表示逻辑与、逻辑或、逻辑非三种逻辑运算关系.10. 布尔逻辑运算的优先顺序当一个检索表达式含有多个布尔算符时,执行的顺序为 not 优先运算,and 其次,or 最后。可用圆括号改变运算顺序,将需要优先运算者置于圆括号中。例如,查找“维生素 C 或维生素 E 对糖尿病患者肾脏的保护作用” ,检索式为:(维生素 C or 维生素 E)and 糖尿病 and 肾。11. 截词检索截词检索,利用截断的词的一个局部即截词,进行检索的技术自动地对同一概念检索词的不同词尾变化、词根相同等一类提问词进行检索,并自动用 OR 连接各词的检出结果,避免文献的漏检和
11、逐词键入的麻烦,提高查全率;常用的截词符号有“ * ” 、 “ ?” 。12. 限定检索 又称限定字段检索,是利用检索词出现的字段进行的检索;用户可以指定检索某一字段或某几个字段以使检索结果更为准确,减少误检;检索系统的限定检索会采用缩写形式的字段标识符;如 TI 表示 Title,AD 表示Address AU=鲁迅;cytokine in TI13. 扩展检索是同时对多个相关检索词执行逻辑“或”检索的技术;即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检出与该检索词同属于一个概念的同义词或下位词的文献,如 PubMed 中主题词的扩展检索。13. 文献检索步骤1分析检索课题,
12、明确检索要求2选择检索工具,确定检索方法 3. 选定检索途径、检索词,制订检索策略式4. 评价检索结果,优化检索策略 5. 文献筛选,获取原始文献 14. 文献信息检索的步骤15. 获取全文的方法1. 本馆馆藏2. 馆际互借3. 网上搜索引擎、期刊主页、OA 期刊网站等4. 直接向著者索取16. 检索效果的评价 查全率与查准率 查全率=检出相关信息量/信息库内相关信息总量 100% 查准率 = 检出相关信息量/检出信息总量100%是评价检索效果的两个重要指标。两者之间存在着相反的相互依赖关系。 应依具体课题需求,合理调节查全率和查准率。17. 检索策略的调整缩小检索范围,提高查准率可以采用的方
13、法(1)增加主题概念面,并用 AND 算符检索;(2)使用位置算符或者用 NOT 排除无关概念;(3)精确为词组检索;(4)选用更确切的下位概念;(5)增加限定条件;(6)限定字段检索;(7)限定检索范围为某一子集或子库;(8)如有主题词检索途径的检索系统,采用主题词检索途径中可以提高查准率的方法,以及主题词途径与其他途径联合检索等。第四章 文摘型数据库检索一.数据库简介1.中国生物医学文献服务系统(SinoMed)由中国医学科学院医学信息研究所研发,是检索国内生物医学文献的重要文摘型数据库。2.SinoMed 由 8 个子库构成,分别是中国生物医学文献数据库(CBM) 、中国医学科普文献数据
14、库、北京协和医学院博硕学位论文库、西文生物医学文献数据库(WBM ) 、日文生物医学文献数据库、俄文生物医学文献数据库、英文会议文摘数据库、英文文集汇编文摘数据库。第 1 节 中国生物医学文献服务系统一.以下 CBM 为例介绍单库检索方法及结果处理:1.收录 1978 以来 1600 余种中国生物医学期刊,以及汇编、会议论文的文献题录700 余万篇。2.全部题录均进行主题标引和分类标引等规范化加工处理。二主题检索1.主题检索指基于主题概念采用规范化的主题词进行检索,是 CBM 的特色检索功能。CBM 采用美国国立图书馆的医学主题词表(MeSH) 中译本和中国中医科学院中医药信息研究所的中国中医
15、学主题词表进行主题标引。2.检索步骤 输入单个检索词,确定主题词。 选择副主题词、是否加权及是否扩展。 若有多个主题词需要检索,则每次检索一个主题词并重复以上步骤对多个主题词进行逻辑组配,直到全部主题词发送到检索框完毕,点击“主题检索”即可。3分类检索中国图书馆分类法医学专业分类表是 CBM 分类标引和检索的依据。第二节 PubMed一、数据库概述1.PubMed 是国际上最重要、最权威的生物医学文献数据库之一,由美国国家医学图书馆(National Library of Medicine ,NLM )下属的国家生物技术信息中心( National Center for Biotechnolo
16、gy Information,NCBI)研制开发。2.其网址是 http:/www.ncbi.nlm.nih.gov/pubmed/ 或 http:/www.pubmed.gov/3.部分文献可直接获取全文,包括: PubMed Central (PMC,收录期刊约 800 种):NLM 开发的免费生物医学数字化期刊全文数据库 开放获取(Open Access,OA)期刊 部分出版商提供的免费文献 二PubMed 的主要来源(1)Medline:PubMed 的主体,这些记录标注为PubMed-indexed for MEDLINE。(2)In-process citations:为加快报道速度,PubMed 将尚未标引 MeSH 主题词、文献类型的最新文献记录先存入临时库,完成加工处理后再转入MEDLINE。这些记录标注为PubMed-in Process。(3)Publisher supplied citation:PubMed 接受出版商提供的电子期刊文献数据,但一些综合性期刊中的非生物医学文献,MEDLINE 并不收录,这些记录标注为 PubMed - as supplied by publisher。(4)OLDMEDLINE :收录 1966 年以前出版且未被 MEDLINE 收录的文献记