1、中山医科大学医学文献检索学教研室,周 纯,Internet简介,在当今的信息社会,随着信息量的激增,传统的信息服务方式和手段已不能满足广大用户的需求。信息服务能力的客观标准:提供信息线索的能力和通过网络技术获取原始资料的能力。电子信息载体正以巨大的优势深入到信息工作的各个领域。,应用新技术作为一种工具对信息事业及图书馆的发展起着巨大的推动作用(巨、大、中、小、微开放体系结构、Client/Server,(C/S))。计算机局域网络和远程联网已成为实现信息手段和信息服务自动化、网络化以及加速信息传递的主要手段,同时也带动社会向信息化社会发展。,信息化社会的建立,其基础:国家公共数据传输网络。,I
2、NTERNET,概况: Internet 网络的网络 全球的网络 信息高速公路最重要基础1969年 Arpanet 1 4台主机 1994年 Internet 150 220万台 1995.2 480万台 1995.7 664万台,Internet - 快速传输信息的通讯手段 资源和信息系统 科技和教育界广泛应用: 美国 大学和科研机构 (LAN - Internet一部分) 日本 教育和科研机构西欧 (大都能使用Internet),21世纪以来最重要的科研工具: Internet 科技工作者了解科技最新 动态 交流学术思想 进行国际合作 资源的海洋 (免费、有偿),Internet在中国,中
3、国的Internet建设,有两层含义,一是我国与国际Internet的连接情况,二是指中国的Internet。1994年我国还只有个别单位如北京高能物理所等与Internet接通,用户通过数字电话系统通过这些单位享受Internet部分服务。Chinanet建设初期在北京、上海两地设枢纽结点,与国际Internet相连。国内与Chinapac、ChinaDDN、祯中继网(ChinaDDN网的祯中继)、PSTN和ChinaMail(X.400)系统互连,构成中国Internet的骨干网。,中国网络(INTERNET)建设中,与科研、教育直接相关的是中国教育和科研网(Cernet),它是中国Int
4、ernet建设的重要一步。,中国教育和科研网(Cernet) 特点:,以“金桥”工程为依托建立骨干网以先进、实用、开放、渐进为基本建设原则 采用骨干网、地区网、院校与科研机构网三级结构 采用TCP/IP协议 首先覆盖科技力量相对集中的高等院校和科研院所 在北京、上海、广州建立国际Internet的接口,TCP/IP协议集,TCP/IP协议集不是国际标准组织(ISO)的协议,但它是INTERNET使用的事实标准协议,各国的INTERNET建设均使用TCP/IP协议。TCP(Transmission Control Protocol,传输控制协议)将信息分组打包,即负责确认收到信息的正确性,发现错
5、误后进行重发。IP(Internet Protocol,网际协议或称Internet协议)将信息送到指定地址,即负责信息传送时的定位与寻址。,TCP/IP协议的特点,(1) 十分灵活 (Local Area Network, LAN、Wide Area Network,WAN) (2) 效率很高 (四层通讯协议(简化),不同于ISO/OSI国际标准) (3) 可靠性高 (纠错较差,实用角度满足需要)(4) 丰富的软件产品(Unix、Oracle、Windows NT)(5) 从技术上讲,对用户屏蔽网络低层结构,不必了解网络硬件连接细节(6) 不指定网络互连的拓扑结构,共享全局标识符(IP地址)
6、来实现网络互连。,IP地址和域名系统,TCP/IP协议集规定了INTERNET上的每一台计算机主机都必须有唯一的“地址”,以保证Internet上所有的计算机和网络能够被互相传送信息而不被混淆,以数字表示,称为IP地址。为确保IP地址在整个网上的唯一性,该地址一般由Internet网络信息中心统一分配。,TCP/IP规定,IP地址一般用32位的二进制表示,而在读写时,为方便用户记忆,通常将32位分成四段,之间用“”作为分隔符,并且将二进制转换成十进制的数字表示,每段数字取值范围为0-255。例如中山医科大学图书馆WWW服务器IP地址为:202.116.108.8。,由于IP地址是由数字来表示主
7、机地址,不便于记忆,一般很少直接使用。为便于使用和管理,Internet建立了域名管理系统(Domain Name System,DNS),即用一组英文字符串来替代难以记忆的数字,称为域名(Domain Name)。域名是一种比IP地址更高级的字符型主机名,由于它采用字符串,便于记忆,所以比IP地址更为常用,例如中山医科大学图书馆WWW服务器的域名为:。,目前使用的域名是一种层次型命名方法,层次型域名的语法是:第四级域.第三级.第二级.第一级也可以解释为:主机名.机构名.网络类型.最高层域名,例如: ux.cso.uiuc.edu ux 一台主机名cso.uiuc.edu ux的管理域 uiu
8、c.edu cso.uiuc.edu的管理域 edu uiuc.edu的管理域 ux这台计算机是由cso.uiuc.edu域命名和管理的,cso.uiuc.edu又是伊利诺斯大学校园网uiuc.edu的一部分,而uiuc.edu又是国家教育机构域edu的一部分。所以,edu包括美国教育机构的所有计算机,uiuc.edu包括伊利诺斯大学的所有计算机。,例如 library 主机名 中山医大域 中国教育界 cn 中国 对应于IP地址: 202.116.108.8 一级域名是一种正式的标准标号: com 商业机构 edu 教育机构 gov 政府部门 mil 军事部门 net 网络支持中心 org
9、上述以外机构int 国际组织 country code 国家(采用两字母编码) (如cn, jp, tw, au等),域名地址和IP地址一一对应,但不存在任何换算关系,如前所述:对应于IP地址202.116.108.8。 INTERNET上信息传递时计算机不能识别域名地址,因此需要“域名服务器(Domain Name Server,DNS)”来从事域名和IP地址之间的翻译工作,以完成“域名地址IP地址”间的双向转换,实现信息的传递。,卫生部Internet建设,CMB资助建立12个C类结点(1995.3) 进入Internet的每一台计算机必须有一个统一规格的、符合IP协议的唯一的网络结点地址
10、,IP地址按区域划分。 主机号 网络地址数 网络主机数A类: 3个8位 126 16,387,064B类: 2个8位 16,256 64,576C类: 1个8位 2,064,512 254 A类用于大型网络,B类用于Cernet的地区网管中心,C类用于校园网。,Internet服务,1. 电子邮件服务 E-Mail(Electronic Mail)2. 文件传输服务 FTP (File Transfer Protocol)3. 远程登录服务(Telnet、Remote Login)4. 信息查询服务 (Archie、Gopher、WAIS、WWW)5. 信息研讨和公布服务 (Newsgroup
11、 & Listserv)6. 娱乐和会话等服务 (Play & Talk),电子邮件,电子邮政地址构成: 用户号主机的域名地址例如: E-Mail的领域比Internet要大,需要针对个人设置地址,而不仅仅是针对机器。,E-Mail允许一个用户:,1. 接收电子邮件 2. 同时向多个收信人发送同一信件 3. 传送包括文本、声音、影像和图形 在内的多种信息 4. 向Internet以外网络用户发送信件 5. 向一台计算机发送信件并由程序自 动对信件内容进行处理,基于电子邮件的信息服务,1. 电子公告板和网络新闻 (BBS & News Groups)电子公告板是Internet网络上最知名的信
12、息服务之一,它开辟一个“公共”空间供所有用户读取其中信息。 电子公告板允许一个用户: 选择若干个专业和兴趣组 定期检查是否有新的消息 “张贴”供别人阅读的文章 “张贴”对别人文章或新闻的评论,网络新闻-最常见的电子公 告板形式电子公告板-网络新闻组 News Groups每一则信息-一篇文章Article 每一篇文章采用电子邮政的方式发给网络新闻组。,2. 专题讨论组(Mailing List),定义一个收信人组,当系统收到向这个组发来的信件后,自动将信件内容的复制件送往组内的每一个成员的信箱内。这种收信人组被称为邮政名单或专题讨论组。一个公共的专题讨论组允许用户从Internet上任何一台计
13、算机发出信件,讨论组所在的计算机中的邮件分发程序(Mailing Exploder)负责对这一信件进行复制和散发。,3.电子刊物(Electronic Journal),随着网络的不断发展,电子刊物这一新的出版形式在Internet上不断得到普及。一些电子刊物会不断将文章送到订阅者手中,这些文章可能是作者刚刚完成的,甚至是尚未最后定稿的。还有一种刊物只是告诉你每一期的目录和其中每一篇文章的“藏身之处”及获取方法,用户可自由挑选感兴趣的某几篇通过网络得到。建立这种目录数据库并指明文章全文获取方法是目前发展的一个方向。,文件传输服务 FTP,文件传输是以其遵守的文件传输协议(File Transf
14、er Protocol)命名的。FTP规定了在Internet网络上如何传输文件,通常要由专门FTP程序来具体实现。用户可通过有名或不记名(匿名)连接方式对远程服务器进行访问,查看和索取需要的文件,也可以将本地主机或节点机的文件传输到远程主机上。,远程登录,信息查询服务,信息查询(检索)服务是在E-Mail、FTP和Telnet基础上开发的,简单介绍以下几种工具。, Internet上的信息资源十分丰富,这些公共、免费和共享的资源,存放在供公众自行取用的公共FTP站上,设有一个固定名称的免费帐号(anonymous)。这些软件就需要通过Archie来获得。 Archie每月运行一次,自动巡视和
15、扫描Internet上每一个服务器和匿名FTP的地址,对服务器上的文件进行标引并编制目录,然后将所有服务器上的目录进行汇总。网络用户可通过anonymous FTP进行远距离检索,包括词串查询、文件名查询、关键词查询等。, Gopher的开发者们创建了一种特殊的可引导未受过培训的学生进行信息查询的方法。基于菜单驱动,可将用户的请求自动转换成FTP或Telnet命令。在菜单的引导下,用户可以对Internet上的远程联机系统进行实时访问。当发现你感兴趣的东西时,你可以通过Gopher阅读或获取它,而不用关心域名、IP地址、改换程序等。, 广域信息服务器(WAIS, Wide Area Infor
16、mation Server),又称数据库的数据库(Database of Database),是用来供用户查询分布在Internet上各类数据库的一个通用接口软件。用户只要在WAIS给出的数据库列表中用光标选取相应的数据库并键入查询关键字,系统就能自动进行远程查询,帮助读出相应的数据库中含有该查询词的所有记录。, 网络信息查询 WWW是“环球网”(World Wide Web)的简称。是种基于超文本(Hypertext)方式的信息查询工具。WWW通过这种超文本的方式,把全世界Internet上不同地点的相关信息有机地结合起来,并提供了在信息网络内从一个文献迅速转移到另一个文献的手段。用户仅需提
17、出简单的查询要求,然后根据系统返回的结果决定下一步的行动,而具体到什么地方查询及如何查询则由WWW自动完成,对用户来讲,可以不用关心信息资源究竟放在什么地方。,WWW的主要成份,1. 超文本标记语言(HTML) HTML是由CERN提出的WWW描述语言。HTML文本是由HTML命令组成的描述型文本,HTML命令可说明文字、图形、动画及声音、表格、链接等,HTML的连接可以使文本中的每一个词或图形又可以连接Internet中相同或不同位置的另一种文本或媒体信息,用户通过浏览器读取HTML文本并得到相应媒体表达效果。,Hypertext(超文本) Web的操作依赖超文本作为它与用户相互连接的手段。
18、超文本与常规文本相同,也可以被存储、检索、阅读和编辑。但它有一个重要特性,即超文本中含有与其他文件的链接。人们把这些链接点称为“锚”(Anchor),或称为参考点(Reference)。它代表与另一个超文本文件的关联。例如,在一个图形终端上,一个特定的参考点可以被表示为带下划线的文本,或者是一个图标。用鼠标点它一下,则与它关联的文档就会显示出来。,Hyperlinks(超链) 在超文本中,超媒体的“参考点”形成的链接叫超媒体链环,简称超链(链接)。通过超链,你可以在计算机屏幕前连续不断地选择你所感兴趣的题目,去调阅你所要阅读的内容。,HTTP(超文本传输协议-HyperText Transmi
19、ssion Protocol) HTTP是Web服务器和Web浏览器进行通讯的语言。所有的Web服务器及浏览器必须遵循这一协议,才能发送或接收超文本(超媒体)文件。Web服务器又称HTTP服务器。从某种意义上讲,WWW是HTTP服务器网络的集合体,以及用HTTP可读写的全球信息的总体。,2. 客户机和服务器 WWW客户机指在Internet网的一个站点请求WWW文档的计算机,服务器指网上保存WWW信息的计算机,它利用超文本传输协议(HTTP)允许用户在客户机上发出请求,访问超文本和超媒体信息。,3. 浏览器和制作工具 WWW服务的客户程序称为浏览器,与其它应用中的浏览器不同的是, WWW浏览器
20、不仅可浏览简单的ASCII文本, 还可以浏览HTML中所能描述的图形、声音、动画、表格以及进一步的连接信息。,4. 起始页(Home Page) 当启动Internet上某个地址上的文档文件时,首先要显示的那个文档。使用WWW 的每一个用户都可以建立自己的起始页文档。在该文档中,可以加入表征用户特点的图形或图象,列出最常用的一些连接。对于经常使用相同资源的集体或单位,如一家公司、研究所或大学等,都可设计自己的起始页。,相关概念:URL(超文本文件在网络上的地址-Uniform Resource Locator) URL用来在网络上表示超媒体的链接。要在个人计算机上显示一个文件,必须给出文件名及
21、其路径。我们可以把URL看成是标准的文件名概念在网络上的延伸,你不仅可以指向一个在某目录下的文件,而且这个文件、这个目录可以存在于网络上的任何一台计算机上。gopher:/http:/ Wide Web Virtual Library (WWW虚拟图书馆) 与普通的图书馆的概念不同,WWW虚拟图书馆是一个分布式资源系统,其内容包罗万象,用户通过访问“虚拟图书馆”与各种分布在Internet上的资源连接,可以较方便地了解和获取自己感兴趣的信息。http:/www.w3.org/hypertext/DataSouces/bySubject/Overview.html,Www信息检索工具(搜索引擎)
22、,见网络信息检索章节,Internet的连接,联机服务(仿真终端)方式:联机服务是用户加入Internet的最简便方法。用户需配备:计算机、普通通讯软件、调制解调器(Modem)和电话线,并在Internet联机服务商那里申请一个帐号。连接时,用户以拨号方式与联机服务提供者主机相连,成为主机一台仿真终端,通过联机服务系统查找或调用Internet资源。 此种连接方式不具备IP连接性,没有实现与Internet的真正连接,资源的使用受到限制。,SLIP/PPP方式: 使用此种连接方式,用户需配置:计算机、Modem、 电话线以及附加了SLIP/PPP的TCP/IP软件,同时还需在Internet服务提供商处申请一个SLIP/PPP帐号。 因用户在自己计算机上运行了TCP/IP软件,计算机与Internet网之间具有IP连接性,也就成为Internet网上的一台主机,可以使用其全部功能和服务。,专线连接和局域网方式:专线连接主要针对于业务量大的用户、群体用户以及国际间的连接,用户需要配备:计算机、路由器或网桥,并向邮电部门租用专线或建立无线通讯。连接时,用户的计算机或网络经过路由器连接到Internet服务提供商的路由器上,并安装TCP/IP软件。用户还需申请IP地址和域名。,