1、区域数字图书馆的云服务模式探讨,刘柏嵩宁波大学图书馆,2009.03宁波数字图书馆研讨会,汇报提纲,一、背景及概念 二、业界现状三、数字图书馆云服务模式,一、背景及概念,当前背景,Web1.0无处不在:超文本的Web,聚众 Web2.0生机勃勃:互动的Web,分众Blog,Wiki,Tag,Folksonomy,SNSP2P,Grid,云计算SaaS和SOA3.0破土而出:数据的、智能的Web,个性化Will the Internet Soon Outsmart Us?2008年的动画片Wall-E,电脑完全智能化,它能识别你的语音,理解你的行动,所有活动都在电脑的操纵之下,而人类无所事事。,
2、2009十大技术趋势,-Michael Stephens,无所不在的云计算The Ubiquity of the Cloud。信息技术的角色变迁The Changing role of IT。 共同发掘信息共用的价值The Value of the Commons。 “微交互”起大作用The Promise of Micro-Interaction 关爱并培育你的部落The Care & Nurturing of the Tribe 让我们彼此鼓励、彼此温暖,增加心中的力量I hope that we encourage the heart 手持设备势如破竹The triumph of the
3、 Portable Device 个性化的重要性逐渐突出The importance of Personalization 本地化的影响日益显现The impact of Localization 数字生活不断进化The evolution of the Digital lifestyle,云计算的出现,IT 分析师,财务分析师,IT 消费者,终端用户,Common Attributes of CloudsEnhanced user experience Elastic scaling Automated provisioningHighly virtualized,Source: IBM C
4、orporate Strategy analysis of MI, PR, AR and VCG compilations,Anywhere access to applications through a simplified user interface,Rapid time to market for new services.Anywhere access to applications through a simplified user interface,Ability to elastically scale resources and maintain high quality
5、 of service,Ability to elastically scale resources at significantly lower incremental management cost,基本概念,云指的是互联网。云计算(Cloud Computing)是一种新的IT资源提供模式,依靠强大的计算能力,使得成千上万的终端用户不担心所使用的计算技术和接入的方式等都能够进行有效的依靠网络连接起来的硬件平台的计算能力来实施多种应用。13年前初显雏形,那个分布在全球电脑上的寻找外星et的屏保就是一个云计算的平台 IT界称之为:第五种公用设施;第五代计算另四项:水、电、气、电话;主机,PC
6、,CS,BS,基本概念(二),狭义上的云计算是指用虚拟技术构建的虚拟化数据中心,将分布在大量的计算机和存储设备(包括本地或远程设备)上的计算和存储资源(包括内存、I/O设备、存储、带宽、计算能力等)集中起来成为一个虚拟的资源池,以服务方式按需(免费或租用)提供给网络用户。这种云计算被称为“基础设施即服务”IaaS(Infrastructure as a Service,也被称为“硬件即服务”HaaS,Hardware as a Service)的模式。Amazon的E2和E3是这类模式的代表。,基本概念(三),广义上的云计算还包括软件即服务SaaS(Softwre as a Service)、
7、平台即服务PaaS(Platform as a Service)等多种服务模式。SaaS通过浏览器把程序以服务方式交付给用户,向用户收取服务费。用户通过互联网使用程序,降低在服务器和软件的购买及系统运维成本;供应商只需统一安装和维护一套软硬件系统,如S等。很多SaaS还提供了开放API,让开发者能够开发更多的互联网应用。PaaS将把开发环境、应用程序运行环境、数据库环境等作为一种服务来提供给开发商,由后者开发程序并通过互联网提供给用户。这类服务商有Google的应用软件引擎Google AppEngine和Salesforce的网络应用软件平台等。图情界一般引用其广义概念,云计算的形式,云计算
8、的内涵非常丰富。云计算形式包括:以服务为交付模式的计算和存储基础设施;包括虚拟主机租用、应用服务环境租用、数据库环境租用、编程模型、数据服务(Data as a Service)、商业流程服务(Process as a Service)、应用服务(Application as a Service)等各种模式。云计算的特性:对资源动态分配;以Web为中心;交付的是服务。,二、业界现状,目前,Computers aregreat tools for,例如, Google 和Microsoft 都拥有Web网的拷贝,以方便进行对全球Web的索引,huge amountsof data,将来,Comp
9、uters will stillbe great tools for,huge amountsof data,计算机将自动对,全球信息,云计算业界现状,应用服务(SaaS),应用平台,服务平台,存储平台,Amazon S3, Dell, Apple, .,3Tera, EC2, SliceHost, GoGrid, RightScale, Linode,Google App Engine, Mosso,F, Engine Yard,Facebook, Heroku, AWS,MS Live/ExchangeLabs, IBM, Google Apps; SQuicken Online, Zoh
10、o, Cisco,亚玛逊云计算,云服务示例- Amazon,Simple Queue Service(简单排列服务) Simple Storage Service(即S3,简单的存储服务 Amazon Elastic Compute Cloud(弹性计算云,EC2、EBS )Amazon Flexible Payments ServiceAmazon SimpleDBAmazon DevPay云计算服务的领跑者亚马逊继续保持着领先的位置,Amazon S3简单存储服务,Object-Based Storage1 B 5 GB / objectFast, Reliable, Scalable R
11、edundant, Dispersed99.99% Availability GoalPrivate or PublicPer-object URLs & ACLsUS & European Locations(目前只对欧美服务),Google云计算,云服务示例- Google,GoogleApps -2007年AppEngine服务平台-2008年4月 开发者可借助谷歌的AppEngine开发新的WEB应用 Google推出了Chrome浏览器 -2008年9月 一是技术开源,二是对Google AppEngine运行速度快,针对性强 Gmail运行Google多个IDCGoogle云计算已
12、经拥有100多万台服务器,Google云计算数据中心,Google-云能提高处理速度,云计算模式中,用户所需的应用程序并不运行在用户的个人电脑、手机等终端上,而是运行在互联网上大规模的服务集群中。谷歌处理1TB数据只需68秒;1PB六个小时 Google只需68秒钟就能完成对1TB数据的排序处理。这些数据都是未压缩的文本文件,使用Google File System文件系统存储在1000台计算机上。在此之前,Google处理分布于910台计算机上的等量数据需要耗时209秒。数据量不只是TB级别,还能为一千倍的PB级别。在今年1月份的时候,Google MapReduce平均每天的数据处理量是2
13、0PB,相当于美国国会图书馆今年5月份存档网络数据的240倍。,IBM云计算,云服务示例- IBM,Cloud Computing,Service Catalog,DatacenterInfrastructure,Virtual Client service,Web Application Service,Compute Service,Database service,Storage service,Content Classification,Storage backup, archive service,Job SchedulingService,Collaboration Servic
14、es,Orchestration of Technology, Processes, People & Data to fulfill end-user requests and operational tasks,IBM云服务管理示意图,Technology,End User Requests& Operators,ServiceDefinitionTools,ServicePublishingTools,ServiceFulfillment &ConfigurationToolsUI, Fulfillment, Data, MetaData,ServiceMonitoringToolsKP
15、Is,ServicePlanning,Infrastructure & Virtualization,Service CatalogRequest UIOperational UI,Platform Management Services,Provisioning Services,Energy Management Services,Assets, Configuration Items,服务请求,IT 基础设施 & 应用提供,服务创建与部署,Simple Deployment Automated Provisioning,Data Center ModelReservations,Comp
16、lex Service Requirements,Tivoli Process Automation Architecture,面向企业推出的云服务融合 Web 2.0 的协同服务 Enables collaboration beyond the boundaries of an organization Provides the essential software to help teams of people work together Connect from anywhere, anytime Focus on business, rather than worry about IT
17、,IBM的 “Bluehouse”,IBM and Partner Confidential,微软云计算,云服务示例- Microsoft,2008年10月份,微软相继发布了一系列产品,以迎接“云计算”时代的到来 推出了新操作系统Azure,企业用户既可以在公司电脑上运行,也可以经由微软通过互联网提供相同服务;将以“即用即付”模式对Azure定价; 新推出的Windows Live可以让个人用户与好友一起存储、恢复和共享图片、博客和其它网站内容;推出企业版Exchange电邮的网络版和Office网络版。,云带来的变化,最重要的产业变化体现在5个方面:第一,信息产业从PC 时代走向互联网时代,
18、而产业也将从PC时代的应用为中心走向以数据为中心,谁拥有最多、最智能、最结构化、最相关的数据,谁就拥有优势。 第二个变化体现在,PC功能和定义将发生很大改变,虽然PC仍是重要的工具,但PC将走向PC+:个人计算能力进入手机、电视、汽车、传感器等,只要有电的地方都有计算的时代。 第三个变化是,计算的架构从过去集中于PC或服务器的某一“端”走向“云”+“端”,即C+C(Cloud+Client)。 第四个变化是,软件企业的业务模式从软件走向了“软件+服务”。 第五个变化是,市场的基础将从过去几十年来服务了第一个10亿人(1B)走向服务更多用户。“云计算”已经能够把PC上好的应用放到手机、电视等终端
19、设备上,让发展中国家的用户先体验到“云计算”带来的服务。,三、DL中的云服务模式,当前数字图书馆所面临的困境,用户的多样性面对不同学科和研究方向、不同层次的用户来自高校、科研机构、企业和政府用户对资源的需求的多样性每个用户对文献资源的需求都是个性化的整体用户对文献资源的需求是广泛的文献资源需求范围的边界是模糊的用户对服务的需求的特点用户对服务的需求也是个性化的服务需求是不断创新的,用户在工作中需要什么?,检索文献跟踪最新进展文献资源的使用、管理下载文献资源的组织、保存与再检索阅读笔记、报告、论文、实验数据、图表起草、保存、版本、学术交流讨论、咨询、会议、,面向科研学术活动的信息服务,需求调研,
20、科研实施,成果共享与推广,科研数据采集与分析,学术论坛,交流通讯(微软、北电的统一沟通平台),文献管理(noteexpress,endnotes、refworks),项目管理(Project、Jira),企业需求与技术转移,文献资源查找,网络出版(Apabi),机构知识库(Dspace,Eprints),项目申请助手,信息检索与搜索引擎,服务开始渗透到活动全过程、全方位,数字图书馆与读者的关系,数字图书馆为用户提供一个学习与研究的平台海量文献资源专业的、个性化的服务学习与研究的工具决策参考工具本地化信息化服务:地方文化、旅游、经济,DL的云模式需求,包括两个方面:云构建和云提供基本服务硬件及应
21、用托管提供计算服务和存储服务资源整合高级服务链接整合,统一检索数字资源调度服务用户行为分析、资源访问统计及分析读者的观点为、评价挖掘用户不管资源在哪,是哪个数据库,希望最快、最直接的方式,得到他所希望的文献格式,DL云服务的构建从管理者角度,区域数字图书馆云服务的构建:云平台以基础设施服务IaaS和基础平台服务PaaS为基础,包括以下4个方面的内容:1)面向图书馆的数字图书馆公共服务平台;2)面向图书馆的数字图书馆SaaS服务平台;3)面向图书馆的数字图书馆本地服务平台(包括本地应用基础平台和本地应用系统);4)面向图书馆的数字图书馆服务整合平台开放架构,以便将不同的图书馆本地服务、区域DL公
22、共服务、行业公共服务以及第三方公共服务集成起来,DL云服务模型图,Applications, Processes and Information as a service,软件平台服务(中间件 桌面,应用服务器,数据库服务器, 门户服务器等.),公共云(Google,NSTL,CALIS,CSDL),私有云(本地数据中心),混合云(public and private),服务接口,数字图书馆公共服务平台,该公共服务平台由一组软件构成,可以在云中使用,提供的基本服务包括:统一认证服务、计费服务、联合资源检索服务、数据服务、知识服务、数字对象存储和下载服务、元数据联合编目服务、文献联合订购服务、全
23、局资源调度服务。上述服务既可以直接面向图书馆,也可以通过一组Open API提供给图书馆,数字图书馆SaaS服务平台,SaaS服务平台直接面向图书馆提供最终的应用服务。包括馆际互借SaaS服务、参考咨询SaaS服务、特色库加工SaaS服务、教参管理SaaS服务、学位论文SaaS服务等。各个馆可以按需租用部分或全部服务。,本地服务平台,本地应用基础平台 具有统一服务注册和管理、统一监控和日志管理、本地统一认证/授权、单点登录、公共服务发布、外部服务订阅功等核心功能。提供状态管理、负载管理等实时服务,提供简化和自动化的部署和管理方式,保证服务的可获得性和伸缩能力 本地应用系统 用于为图书馆提供具体
24、的业务功能,数字图书馆服务整合平台,用于实现跨云的服务集成,以Open API方式对外提供抽象化的应用服务。该平台还能对区域成员馆的Open API提供托管服务。该平台用于将不同的图书馆本地服务平台、本区域DL公共服务平台以及第三方公共服务集成起来,以统一服务接口方式提供给图书馆,供图书馆、区域DL和ISV进行进一步整合(mashup),降低服务集成难度,从而能形成高度集成的数字图书馆系统,以统一的界面和操作方式为读者提供服务,服务整合,统一基础信息 数字图书馆云服务平台建立和管理统一的基础信息,包括用户信息、知识库信息、应用/资源/服务/仓储注册信息、数据信息、订阅信息、计费信息等。这些信息
25、为服务整合奠定了基础。 统一API Open API是web 2.0的一种服务模式,也是云计算的服务方式。利用这些API可以实现对分散数据和服务进行整合(mash-up),能带来有新价值的web服务。,服务整合(二),统一认证 统一认证是实现服务安全整合的前提 云服务平台能为各个云服务中心的所有用户提供统一的用户通行证,使得用户能在各个云服务中心和图书馆本地平台之间实现跨域的单点登录和身份认证 服务整合和托管 各云服务中心都提供Open API,部分图书馆和其他ISP(独立服务提供商)也会提供部分Open API提供各类服务的注册和管理功能,提供了通用的认证、授权、计费和安全等服务,能简化服务
26、集成,支持服务的快速接入和交付,DL服务平台,服务平台提供的所有服务分为三个层次: 系统内的私有服务:同一系统内的私有服务的注册和管理由OSGi基础框架完成。这些服务无需对系统外提供。馆内/平台内的私有服务(即私有API),可以被同一个平台内的其他系统调用,如,读者借阅 馆/平台的公有服务(即Open API)可以被另一个馆/平台所访问,例如,OPAC,云服务的提供从用户角度,面向用户的元服务组装设计面向不同的用户层机构或子机构读者类群:学科、专业方向、研究方向、企业、最终读者面向不同级别的最终读者初学者资深者研究者,数据连通,按照用户需求进行数据的整合机构数字图书馆学科数字图书馆个人数字图书
27、馆(在线)整合不同来源、不同类型的各种数据中文、英文、期刊、报纸、学位论文、整合的深度元数据级的整合,服务的互连通,统一服务协议例如,订阅服务:通过统一的订阅服务协议,订阅不同系统的服务服务构建由不同系统的元服务构建成一项新的服务服务来源于外部公共“云”,本地私有“云”用户不管服务来自哪里,本地,其它DL,其它数字图书馆联盟,云成为信息服务的超级引擎,地域化的互联网信息服务的重要组成网络档案产业(面向产业的特色库)商家档案,服务档案社区交友人物档案专家学者档案信息资源区域数字资源整合网页资源,学术交流:学术社区网络,以文献资源为基础建立起来的学术社区网络研究人员通过文献发现相关的研究人员研究人
28、员之间建立联系,并构建社交网络交流手段即时通讯邮件实时讨论会大型网络会议,如何使用这些服务,开放平台开放自身API,资源整合关键业务环节均通过HTTP结合XML封装请求与返回数据的形式封装成调用API,支持应用系统可以二次集成开发例如,学校的教务管理系统中可以调用图书馆的教参服务集成开放API,集成互联网有价值OpenAPI,如词典、Google Map、Open Social等,开发更丰富的应用功能文献搜索引擎,提供SEO或元数据打包索引服务,结合链接解析服务,让终端用户可以在搜索引擎检索和应用机构用户资源智能化服务:语义搜索,自动回答问题,多种媒体融合以任务为中心,用户界面围绕读者想要做的
29、任务,多个服务的组合,DL云服务的优点,提供服务的图书馆不一定需要专门的硬件能够快速部署各种应用和服务减少IT管理和运维的复杂度节省整体投资按次付费及时的可扩展性就象NBDL,运用超星的云安全性可依赖性服务APIs用户无需学习不同服务的操作和界面,直接在用户熟悉的环境中使用各种资源和服务,DL云服务-具体示例,多馆多库的链接整合中英文相似文献相似文献引证文献参考文献二次引证文献相关研究机构相关研究作者,实现区域资源调度与文献传递,自有资源直接获取。团购资源分中心下载。它馆资源:原文传递系统。虚拟参考咨询系统。文献服务响应时间:直接下载园区中心2小时。园区它馆4小时。混合云资源 6小时(紧密合作
30、型)外部云资源24小时。,构建区域学术资源服务的“云”,Web2.0技术的广泛应用更多的用户互动,图书馆不仅仅只是一个资源获取的平台,更是一个信息互动平台用户不仅是资源和服务的使用者,也是新的资源的服务的提供者webblog, RSS,Tag等新技术的引入富界面应用的出现以服务为中心图书馆重点不再突出应用和资源,重点在于能给用户提供何种服务在上述各种服务的基础上,可以混搭出新的服务,结束语,网络发展的必然结果,DL云服务的终极目标,云计算是目前IT发展速度最快的;云里雾里,在全球超大的云计算平台中,有一朵DL云。 用户象使用水、电一样,通过互联网,或各种计算终端,方便地使用本地和远程数字图书馆所提供的各种资源和服务。,谢谢!请批评指正!,