1、浅谈基于本体的可重构丢口识管理系统研究综述 论文关键词:本体本体进化可重构知识管理 论文摘要:本体作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,在应用领域中得到了广泛的使用,然而企业内外部环境的改变,对本体提出了新的要求:本体必须不断变化以适应新的知识结构,即实现知识管理系统的可重构性。因此,基于本体的知识建模方法,从本体变化的角度分析了实现可重构性的方法、技术和工具,最后,总结了目前研究尚存在的缺陷以及未来可能的研究方向。 1 引言 1 I 研究背景介绍 随着知识经济时代的到来,知识管理受到越来越多的关注,它跨越了众多的学科,在众多领域得到 研究和应用,如:产品设计领域、工艺制
2、造领域、医药生物等。在不断的研究和实践中,人们设计和开发了各种知识管理系统、知识管理工具。但是,企业处在一个开放式的、不断变化的环境中,一旦环境发生改变,知识结构就要修改或补充,而已有的系统和工具不能满足这些要求,因此,如何实现可重构的知识管理系统成为迫切需要解决的问题。 1 2 相关定义 定义 i:本体 (ontology)。本体是共享概念模型的明确的、形式化的规范描述。它包括概念模型、明确化、形式化和共享四层含义。本体由类、属性 (又叫槽 )和个体及其之间的 关系构成。 定义 2:本体进化 (ontologyevolution)。它指在本体发生改变后,本体管理系统不会丢失数据或能保持一致性
3、的能力。本体进化关心最新版本的有效性。 定义 3:本体版本 (ontologyversioning)。它指在本体发生改变后,本体管理系统允许访问不同的版本。本体版本处理有效性、互用性和所有以前版本的管理。 定义 4:可重构知识管理系统。它指企业可以根据自身的特点来定制 (包括改变和扩充 )知识结构框架,而相应的知识录入、维护、检索和显示界面等可以自动调整 (或允许 用户定制 ),以适应新的知识结构。 2 本体变化与可重构知识管理系统 2 1 基于本体进化的方法和理论 由于领域知识是经常变化的,所以描述这些知识的本体也需要作出相应的变化,以实现知识管理可重构性的需求。如前所述,本体进化与本体版本
4、的侧重点不同,本体进化关心的是新版本本体的有效性。怎样满足新的知识结构、本体一致性的特征都将是本体进化所要研究的内容。 德国 Karlsruhe 大学不少学者对本体进化等做了深人的研究。LStojanovic 等人结合他们已经开发的 KAON(Karlsruhe 本体和语义框架 ),将本体进化流程分为 6个阶段:俘获改变、表示改变、语义变化、执行改变、延伸改变和改变生效,该流程系统地分析了知识改变的原因和结果,确保执行改变后的本体及其依赖产物依旧保持它们的一致性。 为了满足不同用户的需求,该研究还让用户参与解决本体的变化问题,允许用户设置高级的进化决策,建议用户发掘潜本体应用中的本体、实例或用
5、户行为的可能变化。但 LSto janoc 等人的研究对本体的具体操作处理得不够详细,对变更的描述也存在缺陷,因此谢强、张磊提出了基于用户自定义变更的本体进化方法 (0E UDC),将用户自定义变更转换成原子变更,实现了本体变更的形式化描述问题。 浙江大学人工智能研究所的周明建等,在以 OML 为本体建模语言的基础上提出了 EDOCOM 框架,见图 1。该框架的特点是: (1)在处理进化前,已对可能存在的冲突进行分析和解决; (2)对于系统进化过程中,少量不能自动更新的内容,采取公告管理的方法进行手动修改; (3)为版本管理和进化提供了充分的信息使其得以恢复到进化前的状态。由于本体进化中会涉及
6、到概念的修改和补充,但是该概念本身会和其他概念或类之间存在复杂的关系,如何实现对此 概念的修改,与之关联的彼概念能自动完成修改,是本体进化的一个关键点,本文献对此介绍得不够具体。此外,该框架面向的是 OML 语言,无法兼容 W3C 推荐的 OWL 语言。 华中科技大学孙小林在其博士论文中提出了基于 2一型模糊逻辑推理的本体进化方法,弥补了本体系统对模糊信息研究很少的现状。该方法采用 2 一FSWRL 本体存放知识库,以数据挖掘中增量式层次聚类算法为基础,构造一种基于 2一型模糊描述逻辑的本体进化模型来实现 2一型模糊本体半自动的构建与进化,不仅可以大大减轻本体构建初期的人工参与力度与工作量,而
7、且能够 使本体在环境发生改变的时候迅速做出反应。 2 2 基于本体版本的方法和理论 为了完成本体版本交互和共享的功能,近年来研究者们开发了许多致力于管理、修改、进化本体的工具和系统。很多本体编辑工具,像 prot6g6、OntoEdit 都会有一个本体变更日志来记录本体的版本变化,但是本体变更日志在不少情况下是难以获取的,比如在语义网中,我们仅能得到新老版本的本体,而不是它们在变更时的纪录。鉴于此, MichelKlein 等建立了一个改变设置,与日志不同的是,它只记录必要的操作记录、操作不需要按顺序记录以及 记录方式不唯一。既然变更的方式不唯一,那么必须有一个统一的方法来整合这众多的变更,因
8、此, MichelKlein 等又提出了一个集成所有变更的框架,实现了本体一致性的要求。 针对当前本体变化研究中本体变化的约束模型和算法缺失问题,柯贤达引入了本体变化表达的元数据模型,以一个类概念来表达本体的某种变化,扩展建立一个 Modify Inst 类,描述和记录知识实例的变化,这一点与 MichelKlein等的想法一致,不过后者的本体用于记录基本变更操作和复杂变更操作。为了保证变化操作发生后本体的一致性,柯贤达提 出用特定的算法来表示每一种类型的本体变化的约束。如果某一本体变化类型 t对应的约束算法为 C,则这种对应关系可以表达成为二元关系 Corresp。ndence(t, c)。
9、其中 tCchg , CRulesCheckAlgorithm 。RulesCheckAl gorithm 算法用于检测该本体变化操作是否可以执行。每一种类型的本体变化对应一个检测算法。而所有这些约束算法构成的集合称之为 ChangeCheckAlgorithmBase。 本体版本的研究的另一个方面是版本的匹配问题,不同版本间的单向匹配不能 够满足用户的不同需求,如何实现版本问的双向匹配,实现数据共享和重用的能力,是本体版本研究的一个重要问题。中科大赵思阳等提出了一种新的本体版本匹配方法,方法可以对同一本体的两个版本同时进行正向和逆向匹配,将不同版本中的相似元素联系起来并相互转换。其中,本体的
10、双向匹配用一个五元组 E1, E2, R, TE, M来表示, E1, E2 一两种不同本体版本的匹配元素, R 一匹配关系, TE 一转换表达式, M 一元数据。在匹配方法的实现上,采用双向转换表达式来描述双向转换,提出使用单向表达式求逆的方法来将单向匹配表达式扩展到双向转换表 达式,从而简化了匹配算法。 PieterDeLeenheer 提出了一个管理和修改多本体版本的独立于模型的框架。为了保持表示模型的独立性,它选择可能世界本体来抽象地表示本体及其进化过程;此外,它受信度网的启发,对版本的转化进行了分类,它们是修改,扩展,压缩和维持原状。在研究的最后,作者介绍了框架实现必须具备的元件:本
11、体格浏览器,用于定义转化的编辑器及告示 agent。 3 基于本体的实现工具 Pr0t 是斯坦福大学开发的本体编辑和知识获取软件,它提供版本间的日志变更,但是在语义网中, Prot6g6 就显得不足,因为本体的变更变得难以获得,此外, Prot6g6 是手动的输入本体的内容,必须记住其他的方法才能实现数据库与本体库的自动转化。 OntoView 是马德里理工大学开发的本体版本匹配工具,其开发原理受CVS 的影响,它能保持不同网络本体间的互用,维护不同本体的改变以及不同版本概念问的联系。德国的 Karlsruhe大学对本体进化进行了不少研究,开发了 KAON 软件,该软件是目前功能和结构较完善的
12、语义网的支撑软件,能协助大型本体的开发、修改和维护。一般地,它被分成:应用和服务层、KAONAPI 层以及数据和远程服务层三个层次。其中, API 中加入了本体管理和进化的重要元素,如:进化记录、可逆性变更、进化决策、进化图像、带有同步进化的本体蕴含工具、本体发现和用户使用轨迹记录; ()Imodeller 是 KAON 框架的一部分,是一个本体和元数据工程化工具。目前本体进化的需求都可以在 ()I modeller 中实现它完善了 KAONAPI 在本体进化中的以一些缺陷,表现在:本体工程师可以设置进化决策;本体变更执行前,系统会计算其他与之关联的变更;提供了部分撤销重做功能。 4 结论 基于本 体变化的可重构性知识管理系统是最近今年才开始研究的方向。由于它涉及的内容多且面广,因此是一个系统工程,目前还没有哪一个学者或研究机构能够完全实现可重构知识管理系统的所有要求。目前研究中还存在的问题有:大多数的研究还停留在理论阶段,从理论到实践的研究非常少,即使有,侧重的面也比较窄,不能满足所有用户的要求,如孙小林将 2一型模糊描述逻辑应用到在本体进化中的研究;从文献来看,本体进化系统中不少数据不能如人们想的那样,可以自动进行修改、升级和完全共享,从而不能实现知识管理系统可重构性的目的。