精选优质文档-倾情为你奉上第一章 绪论1.数据挖掘要解决的问题:面对高维,复杂,异构的海量数据,如何集中获取有用的信息和知识。2.数据挖掘定义:技术层面上:数据挖掘就是从大量数据提取有用信息的过程;商业层面上:数据挖掘就是对大量业务数据进行抽取,转换和分析以及建模处理,从中提取辅助商业决策的关键性数据。3.数据挖掘的特征:先前未知,有效和实用。4.数据挖掘对象:关系数据库(借助集合代数等概念和方法来处理数据库中的数据)数据仓库(数据集合,用于支持管理决策)事务数据库(每个记录代表一个事务)空间数据库事态数据库和时间序列数据库流数据多媒体数据库文本数据库万维数据库5. 数据挖掘任务:分类分析(按照某种规则),聚类分析(具有共性),回归分析,关联分析(具有关联规则),离群点检测(发现与众不同的数据),演化分析(随时间变化的数据对象的趋势),序列模式挖掘(分析前后序列模式)6.数据挖掘过程:数据清洗,数据集成(考虑数据一致性和冗余),数据选择,数据转换,数据挖掘,模式评估,知识表示。例题:1.1