1、中国专利信息数据库建设的理论与实践研究 摘要:专利信息数据库通过对专利信息的深层次的价值挖掘、技术标注形成的大型信息服务系统,为企业技术研发、专利战略研究、科学决策提供强有力的支撑。文章分析了中国学者关于专利信息数据库的研究现状,并全面研究了中国两岸三地专利信息数据库的建设,并为其进一步发展和完善提出建议。 关键词:专利;专利信息;数据库 一、专利信息文献 专利文献著录项目是各工业产权局为表示专利申请或其他工业产权保护种类申请的技术、经济信息以及可供查询的信息线索而编制的项目,其所代表的信息包括:技术信息、法律信息和文献外在形式信息。 专利的技术信息是通过专利文件中的说明书、附图等文件部分详细
2、展示出来的。为便于人们从各种角度便捷地了解该发明创造信息,通过发明创造名称、专利分类号、摘要等专利文献著录项目来揭示专利的技术信息。专利法律信息包括专利保护的范围、专利的权利人、发明人、专利的生效时间、专利申请的标志等。专利文献 以一种物质形态形式存在,因此专利文献具有文献所拥有的所有文献外在形式,进而就有了表示专利文献外在形式的信息特征。 二、专利信息数据库的研究现状 (一)专利信息数据库建设的基础理论研究 杨巧认为,专利文献信息库具有信息新、传递快、信息量大、可信度高的基本特征。通过检索专利文献信息,可以掌握国际国内科技发展动态和最新研究动向,掌握竞争对手的技术水平,寻找差距,分析预测技术
3、市场的发展前景,制定、调整本企业的专利战略,应对激烈的市场竞争。 王登霄认为,把专利申请人在其他国家, 特别是在工业发达国家申请并取得了专利权的 “ 非中国专利 ” 的专利申请文件集合,从而构成 “ 非中国专利文献信息库 ” ,充分运用非中国专利文献信息库的专利技术,可以为自己创造财富,指导研发,并为研发人员提供创新思维。 马会钧、柴新建、乔立、曹东平等人提出并实现了一种基于现有专利数据光盘信息、建立专用专利数据及查询系统的新模式,以此推动企业利用现有专利信息加快产品的开发速度,并保护自己的知识产权,避免涉及专利侵权纠纷。 吴海燕、张国卿提出了建立专利引文数据库的构想,在统计分析功能的基础上,
4、引入技术发展 相关指数、影响因子、引证率相关指数等统计指标,为评价专利技术的价值及地区、单位、个人的研发水平提供了参考依据。 吴琳、魏星、霍翠婷等人针对专利资源,以 espcenet 数据库为例,研究了一种能有效地从专利数据库中获取高质量双语对译语料的方法。 史波认为专利信息可以帮助了解竞争环境、借鉴已有技术、避免专利纠纷、客观制定竞争策略。 吴海燕在分析了行业专利引文数据库的原则和标准的基础上,探讨了通过 VisualFoxpro 语言建立行业专利引文数据库,依此可以通过初级检索和高级检索到对专 利信息和引文信息的统计,能够使企业快速获得有价值的信息。 代茂军介绍了专利指标数据库的设计,在此
5、基础上提出了一个用Delphi7.0 开发的构建专利指标数据库的转换系统,能够自动完成专利数据到专利指标数据库的转换工作。 (二)专利信息数据库建设的应用实现研究 袁浩利用氨基酸分析的专业知识,结合计算机数据库软件构建了一种新型的专项专利数据库 氨基酸专利数据库。该该数据库搜集整理了自1975 年至 2005 年 “ 中国专利数据库 ” , “ 欧洲专利数据库 ” , “ 美国专利数据库 ” , “ 日本专利数据库 ” 中的氨基酸专利共计 21755项。所含专利文献专一、全面,并由专业人员进行整理、分类后再提供给用户。 程凤伶、石瑛、孙媛从降低知识产权风险、节省研发时间与经费的基础上,分析了建
6、立专利专题数据库的必要性,并从技术主题的确定、检索关键词的选定、主要 IPC分类号的选择、重要专利权人的补充、检索式的编辑和确认等方面,全面探讨了半导体硅材料专利专题数据库的建设尝试。 周辉辉、夏小莺、陈志忠、陈峙东、林缨等人在介绍了专利信息的价值以及专利分类的特点基础上,从确定公司范围、专业技术专利号范围的确定、专利 分类号说明、数据库型式、数据库结构、数据库格式的程度转换以及数据库管理系统的程序语言等方面探讨了柴油机专利数据库的建设。王咏青、任健、顾秀云在介绍大气探测技术专题数据库的特点和重要性基础上,从主题、技术范围、检索表达式、数据采集和数据录入、数据加工处理、数据库字段结构、数据库型
7、式和网络数据库的建立和检索等方面详尽分析了采用 ASP+SQLServer技术建设大气探测技术专题专利数据库的方法和步骤。 代茂军、李红介绍了上海专利统计分析系统的模块组成以及这些模块所的作用,并详尽探讨了如何利用中国专利局专 利信息光盘检索系统 CNPAT( ABS)中的数据来构建上海专利指标数据库。 王豪在收集、整理和分析大量水声专利数据的基础上,研究了基于 Web的水声专利数据库系统的设计方法和实现技术。该数据库系统由专利信息、科研动态信息等数据资源组成,采用基于 B/S模式的三层体系结构,使用先进的 ASP+SQL技术和 “ 瘦客户端 ” 技术研究开发而成。用户只需安装一个标准浏览器就
8、能使用,简化了客户端的技术要求,增强了系统的开放性和灵活性。 黄迎燕、庞景安、李建蓉等人认为专利文献在公布大量专利技术内容的同时,也著录了 专利引文的信息。所以他们从专利引文数据库的建立原则和标准、系统设计、系统功能以及数据库应用等方面探讨了中国专利引文数据库的设计和应用。 刘立丹利用 ACCESS建立了润滑脂专利数据库,其中着重探讨了润滑脂专利数据库的需求和结构及其数据词典,并对其中的表联系进行了设计。杨阳、吴锡军、张赣道等人基于 ADO.NET技术开发了生物农药专利数据库,实现了专利的本地管理和 Web 页面的简单检索、高级检索和分类检索。 三、中国两岸三地专利信息数据库开发建设现状 (一
9、)政府机构开发建设的专利信息数 据库 1、中国国家知识产权局( SIPO)专利数据库:中国国家知识产权局是中国专利审批的政府机构,其专利数据库收录自 1985年 9月 10日以来公布的全部中国的专利信息,包括发明、实用新型和外观设计三种专利的著录项目及摘要,并可浏览到各种说明书全文及外观设计图形。 2、重点产业专利信息服务平台:该平台为配合国务院十大重点产业(汽车、电子信息、纺织、有色金属、石油化工、钢铁、物流、装备制造、轻工业和船舶)调整和振兴规划的实施,发挥专利信息对经济社会发展和企业创新活动的支撑作用,由国家知识产权局牵 头,在国资委行业协会办公室协调下和各行业协会的积极参与下建设而成(
10、以下简称 “ 信息平台 ” ),为十大重点产业提供公益性的专利信息服务。 3、专利信息服务平台实验系统:该系统是由国家知识产权局主办,知识产权出版社开发建设的一个试验性专利信息检索系统,于 2006年 10月开发完成,在 2006年 11月举行的 “2006 年全国专利信息服务与应用大会 ” 上向全国正式推出。于 2007年 4月 26日向社会公众全面开放试运行。收录了中国、美国、欧洲、日本等数十个国家和专利组织的专利文献近 4000 万件,并提供中国、美国、欧洲和 WO 专利的全文检索。 4、上海知识产权(专利信息)公共服务平台是上海为实施科教兴市战略所打造的支撑平台之一,具有包括专利检索与
11、在线分析、专题数据库制作管理、专利信息定制和预警、专利交易与价值评估、知识产权综合管理和其他延伸服务等六大应用功能系统,能够有效地满足不同用户对专利信息应用的基本需求。 5、广东省专利信息服务平台由广东省知识产权局主办、广东省知识产权研究与发展中心承办,并联合国内多方权威专利信息服务机构共同建设而成。平台以向社会各界提供丰富、专业、便利、经济的专利信息为宗旨,致 力于传播专利信息、促进专利技术的推广与应用,满足广大用户对专利信息的需求。 6、中国台湾地区专利数据库:该数据库为付费专利信息平台,成为付费会员后才可进行专利查询、下载说明书、专利分析等功能的操作。对于非会员用户,网站设置了免费查询专
12、区。 7、中国香港地区知识产权署网上专利检索系统:该系统提供简体中文、繁体中文、英文 3种界面。但只有部分内容支持简体中文,对于专利和注册外观设计检索数据库,仍需要用繁体中文进行阅读和操作。通过该系统,可查看香港知识产权署的信息、表格费用、申请注册程序,还可进 行香港专利和注册外观设计的检索,查看知识产权公报。 (二)中国专业性专利信息资料库的建设与应用现状 1、上海硅知识产权交易中心的 “ 集成电路行业专利数据库 ” :该数据库内容覆盖集成电路技术相关的 IC、 IT 等主要高新技术领域,全库涵盖从1975 年至今的国内有关集成电路行业的专利信息(包括所有的集成电路布图设计专有权信息)以及七
13、国两组织(美国、英国、德国、法国、日本、瑞士、中国、世界知识产权组织、欧洲专利局)集成电路行业的专利信息。 2、中国药物专利数据库及其检索系统:该数据库已经收录 了 1985 年至今全部公开的全部医药发明专利文献共计近 13 万条数据,与专利公报已经接近同步,其中包括化学药物近 8万条数据,中药已经突破 5万条数据,是目前国内唯一深度加工标引的专业专利数据库,其加工内容包括:专利发明主题标引、医疗应用标引、范畴分类、文摘重新撰写、化学物质信息标引、中药方剂信息标引,并同时建成了中药材名称数据库,化学物质登记文档数据库等两个辅助数据库系统。 3、中国涉农专利数据库:该数据库由国家知识产权局和陕西
14、省人民政府共同建设的中国杨凌农业知识产权信息中心建成,始建于 2001 年, 2009年进行了重建,是中国第一个农业知识产权信息中心。新建的 “ 中国涉农专利数据库 ” 收录了 1985年至 2007年 4月期间与农业生产生活密切相关的专利信息 16 万余条。该库在每一技术领域下均设有二级或三级目录,便于使用者系统查询。用户在查找信息过程中,既可从申请号、申请日、发明名称、申请人、 IPC 分类号、通讯地址等检索途径单一检索,又可通过相互组配进行限定检索。 4、中国专利基因数据库( NASDAP): NASDAP 主要收录 1999 年以后,部分 1999 年之前(含 1999 年)的基因专利
15、。对尚未授权的基因专利, NASDAP收录申请公开书中的序列,对于已经授权的则仅收录审定授权书中的序列。NASDAP 提供对中国基因专利和专利基因进行研究的免费生物信息学接口,包括序列同源比对 BLAST,微阵列专利序列 BLAST,专利单核苷酸多态性扫描以及专利基序扫描等等。并且还提供普通文本检索工具,用于实现对基因专利标题、摘要和权利要求的检索。 四、研究结论与完善建议 通过以上分析可以发现,专利信息大致上可以分为技术信息、法律信息和外在形式信息。我国已经有学者从基础理论和应用实现等角度去研究专利信息数据库,而 从数据库的开发建设现状来看,我国既有政府机构开发的综合性的专利信息数据库,同时
16、也有针对特定行业或技术领域的专利信息数据库。 为了提升中国知识产权创造、运用、保护和管理的能力,中国已经于2008 年颁布国家知识产权战略纲要。而根据当前全球专利信息的研究和运用现状,中国的专利信息数据库至少应当从以下两个方面加以完善:首先,为了更好地厘清专利技术之间的发展脉络和关联,中国的专利信息数据库应当完善专利引文功能;其次,为了更及时地了解特定技术领域的发展现状和趋势,中国的专利信息数据库应当增加实时专利地图的 制作和分析功能。 参考文献: 1、吴海燕 ,张国卿 .基于专利计量的专利引文数据库的设计 J.科技情报开发与经济 ,2009(22). 2、吴琳 ,魏星 ,霍翠婷 .基于 Web的专利双语语料自动获取研究及实现 J.情报分析与研究 ,2009(9). 3、吴海燕 .行业专利引文数据库的 VFP 实现及应用 D.重庆大学 ,2008. 4、代茂军 .一个用 Delphi7.0开发的构建专利指标数据库的转换系统 J.现代情报 ,2008(7). 5、王豪 .基于 Web 的水声专 利数据库系统设计方法及实现 J.声学与电子工程 ,2008(4). (作者单位:华中科技大学法学院)