1、“ CALIS 高校学位论文数据库 ”可行性研究报告 CALIS工程中心清 华 大学 图书馆2004.4.27汇报内容一、 立项背景和需求二、 总体目标三、 主要建设内容四、 实施方案 (组织管理 、 总体框架 、 技术路线等)五、 实施进度立项背景和需求 背景 近年来,国际范围内学位论文的网上利用已成趋势,可归纳为两种模式:美国 UMI公司的商业性数据库 PQDD采用集中建库、分级服务的模式;由于 UMI较为公平地处理学位论文的知识产权。该数据库在全球范围内的到公认和广泛应用;国内同方光盘公司出版发行的 中国优秀博硕士学位论文全文数据库采用了类同 PQDD的集中建库模式。NDLTD( 博硕士
2、论文网络数字图书馆 )由美国弗吉尼亚理工大学计算机学教授 Edward Fox在 1997年发起建立,目前有世界范围的 185个成员;采用元数据集中建库,学位论文全文由各学校在本地建库的模式。通过 OAI协议收集元数据,用户检索元数据库,通过 OPENURL技术链接到分布在各学校的论文全文。这种模式符合网络环境下数字资源开放建设和分布服务的发展趋势。近几年台湾地区建立的 eThesys系统也采用类同架构。“ 十五 ” 期间, “ CALIS高校学位论文数据库 ” 的建设 参考了 NDLTD模式。立项背景和需求 (续) 需求博硕士学位论文集中反映了学校的教学、科研成果,是广大师生十分重视的一种学
3、术文献。近十几年来,绝大部分学位论文都采用了计算机录入、排版和打印,由此产生了大量的 “ 原生 ” 的电子文本。在没有建立起电子版学位论文( ETD) 收藏机制之前,每年大量的电子文本随毕业生的离校而流失,这对学位论文的电子化利用是非常遗憾的事情。清华大学自 2000年 6月开始进行 ETD全文的收集工作,目前已积累四年 (8批 )电子版博硕士学位论文 1万余篇。立项背景和需求 (续)2001年以来,北京大学、北京农业大学、武汉大学、吉林大学、厦门大学、西安交通大学、东南大学等10余所学校也陆续建立了本校的学位论文提交和发布服务系统,反映了高校普遍希望改变传统纸本学位论文收藏和服务方式的需求。
4、在数字图书馆建设的浪潮下,国内图书馆都在寻找自己的切入点,想做一些数字资源建设方面的事情。而电子版学位论文( ETD) 正是各学校源源不断 “自产 ” 的,最有条件、有能力收集全、利用好的 “ 原生 ” 数字资源。立项背景和需求 (续)在 “ 九五 ” 期间建设的博硕士学位论文文摘数据库基础上,建设一个提供集中式检索(含前 16页全文浏览) 、分布式全文获取服务的CALIS高校博硕士学位论文数据库。为高校范围内的读者通过网络共享学位论文信息提供途径和保障,促进高校教学、科研水平的交流与提高 。总体目标包括三部分:1.分布建立本地学位论文网上提交与 发布系统2.增加 CALIS高校学位论文库数据
5、量 ( 元数据前 16页全文 )3.建立学位论文集中检索服务平台和 共享机制主要建设内容1. 分布建立本地学位论文网上提交与发布系统借鉴国际上学位论文网上提交和利用的经验,综合国内高校的实际需求,接洽软件开发商开发 “ 学位论文网上提交与发布系统 ” ,推荐参建学校使用。从本地系统应用出发 , 促进高校范围内普遍建立起: 新型的学位论文网上提交与管理机制; 本地学位论文全文网上检索服务系统。打破高校多年来以收藏纸本学位论文为主,学位论文文献未能得以充分利用的局面。 主要建设内容 (续)2. 增加 CALIS高校学位论文库数据量“ 九五 ” 期间,高校学位论文文摘库的数据量约10万条。 “ 十五 ” 新增数据量 10万条,新增数据中可提供论文前 16页浏览的比例不低于 80%,可提供全文服务(包括直接下载或文献传递)的比例不低于 70%。“ 九五 ” 期间完成的 10万条数据经转换后与 “ 十五 ” 期间新增的 10万条数据归并在同一数据库结构中提供服务。在 “ 十五 ” 经费支持下, CALIS学位论文库的总数据量达 20万条。 主要建设内容 (续)