知识发现与管理2 知识发现2.1概述基于数据库的知识发现(KDD)和数据挖掘还存在着混淆,通常这两个术语替换使用。KDD表示将低层数据转换为高层知识的整个过程。可以将KDD简单定义为:KDD是确定数据中有效的、新颖的、潜在有用的、基本可理解的模式的特定过程。而数据挖掘可认为是观察数据中模式或模型的抽取,这是对数据挖掘的一般解释。虽然数据挖掘是知识发现过程的核心,但它通常仅占KDD的一部分(大约是15到25)。因此数据挖掘仅仅是整个KDD过程的一个步骤,对于到底有多少步以及哪一步必须包括在KDD过程中没有确切的定义。然而,通用的过程应该接收原始数据输入,选择重要的数据项,缩减、预处理和浓缩数据组,将数据转换为合适的格式,从数据中找到模式,评价解释发现结果。2.1.1知识发现的定义知识发现(KDD)是基于数据库的知识发现的简称(Knowledge Discovery in Databases),指从数据集中提取可信的、新颖的、有效的并能被人们理解的模式的非平凡过程。知识发现的目的是屏蔽原始数据的繁琐细节,从原始数据中提取有意义的、精炼的、能够对用户产生直接影响的