1、火电运维技术知识库技术报告,同方知网(北京)技术有限公司2015年1月,主讲人:张林林,目 录,应用技术及专利介绍,2,产品服务模式介绍,1,后台管理系统,3,一、产品服务模式介绍,1.1 服务模式云租用,1.2 服务模式镜像,1.3 服务模式云托管,二、应用技术和专利介绍,详细部署方案,公司自主研发了中文技术非结构化文档数据库,实现超大数据库的管理与检索。最大数据量可达10T,达到平均500g/s的检索速度,可实现全球10万人同时在线检索。充分发挥知网技术优势,注重数据库的底层开发,知识元库的开发,尤其注重最终用户的使用模式和使用习惯,并将其结合到软件工具中,提供分组排序、知网节等技术,辅助
2、用户的技术分析工作。,技术1自建资源库、异构资源库整合发布及检索技术2-知识元提取技术,多维度进行知识服务技术3-知网节技术,形成完整的知识网络技术4-跨库、跨语言检索技术技术5-个性化定制及动态推送技术技术6海量非结构化知识库管理系统(KBase),技术1自建资源库、异构资源库整合发布及检索,机构平台整合工具:SDIP自建数据库整合发布系统针对有自建库整合需求的用户。要求自建资源已经成库,利用常规的数据库管理系统进行管理异构资源整合发布系统 针对有多种外购资源库的用户。实现多种中外文资源库的“一站式”跨库检索。KDE镜像版二次开发接口针对有开发统一检索平台需求,并需要调用CNKI资源库的用户
3、。,针对本单位积累的自有文献资源和外购资源提供一整套解决方案,针对引进资源数据异构、类型多样、平台软件各异、部署使用与认证计费各不相同、资源之间缺乏相互链接机制等一系列问题,提供了一揽子解决解决方案。,资源整合模块为用户提供了同构资源整合和异构资源整合方案。同构资源,基于CNKI自主知识产权的全文检索数据库Kbase的资源;异构资源,给予非CNKI全文检索数据的资源,如:SqlServer、Oracle、MySql、DB2、Access的数据库资源。针对用户实际情况,我们提供了5种资源整合方案SDIP、ADO、OpenQuery、Z3950/OpenURL、Web访问方式。,技术1自建资源库、
4、异构资源库整合发布及检索,CNKI数据库资源,单位外购资源,单位自建资源,“一站式”检索:,跨库检索全面超越了以往的单一的、面向单库的检索方式,真正实现了“一站式”检索。满足文献调研与情报分析对查全查准率需要。,技术2-知识元提取技术,多维度进行知识服务,以CNKI现有学术资源为依托,利用自然语言处理技术,自动从文献中抽取概念、图片、创新点、数值、表格等各类知识元。知识元技术是CNKI独创的专有技术。在CNKI的作者库、引文分析库、文献标识、文献主题词、发文机构库等进行知识元的互相链接,并实现动态更新。基于知识元链接技术,CNKI的检索能够针对用户当前的检索词提供检索词的相似词、相关词等,从而
5、带给用户更多的文献信息。通过知识元的互相链接和挖掘,可以发现各个知识元之间的相互关系,并根据这种相互关联,得以创造新的知识,有利于用户的知识发掘。 一种基于Web数值表格抽取的数据挖掘方法 中国专利:CN200910084507.9,2009-05-20,技术2-知识元提取技术,多维度进行知识服务,技术3-知网节技术,形成完整的知识网络,知网节是提供单篇文献的详细信息和扩展信息的浏览页面。它不仅包含单篇文献题录、摘要,还是该文献各种扩展信息的入口汇集点。这些扩展信息包括参考文献、引证文献、相似文献、读者推荐文献、相关作者、相关研究机构、分类导航等。 知网节是CNKI所独创的知识挖掘技术,已逐渐
6、成为数据库开发的规范标准,是同方知网申请的一项专利。文献资源知网节的展示结构 中国专利:CN201310347802.5,2013-08-12 基于知网节形式的学术知识表现方法 中国专利:CN201210139486.8,2012-05-08,技术3-知网节技术,形成完整的知识网络,技术4-跨库、跨语言检索技术,制定总库统一的元数据标准,新加入的每一个数据库,都需要按相应元数据要求组织、制作和加工数据,实现总库内容整合,统一网络出版和统一跨库检索。跨语言检索,基于千万量级学术多语言词典和高性能翻译引擎,自动匹配检索词与数据库语种,实现智能翻译和跨语言检索。帮助用户突破语言障碍,扩大外文资源服务
7、层次。检索结果提供多种分组排序工具,帮助读者进一步筛选内容。,2018/9/26,技术5-个性化定制及动态推送技术,围绕读者的研究领域和知识背景,构建个性化的文献调研和情报分析模型,系统第一时间自动推送信息、知识和情报。人找文献转变为文献找人;减少读者45%花费在信息搜索上的时间;让读者专注于自己的科研创新和科研管理。,利用个性化知识定制推送技术,完全改变传统知识检索方式,实现知识动态更新和自动推送,帮助火电厂用户方便、快速、准确地获取所需信息、知识、情报。目的在于不断提高使用者持续学习、知识挖掘及分析能力,从本质上提高用户的深化应用能力。,技术5-个性化定制及动态推送技术,技术6海量非结构化
8、知识库管理系统(KBase),KBase是以管理海量非结构化数据为主、具备智能信息处理能力、具有完全自主知识产权的数据库管理系统。,KBase全文数据库管理系统(简称KBase)是以管理海量的文本、网页、档案、文献、办公文档等非结构化数据为主,具备中文智能信息处理能力的国产数据库管理系统。KBase具有优异的全文检索性能和强大的海量非结构化数据存储管理能力,拥有超过500万词汇量的、大百科式的概念关系词典,具备业界领先的中文智能信息处理能力。Kbase数据库引擎已面向全国数千家机构用户服务,稳定性、检索速度、准确率都得到用户认可。,一种基于整数映射的XML数据库全文索引方法 中国专利:CN201310071130.X,2013-03-06,技术6海量非结构化知识库管理系统(KBase),三、后台管理系统,谢谢!,