精选优质文档-倾情为你奉上1、简单描述一下数据挖掘的过程(P9-P10)(1)数据清洗:清除数据噪声和与挖掘主题明显无关的数据(2)数据集成:将来自多个数据源中的相关数据组合到一起(3)数据选择:根据数据挖掘的目标选取待处理的数据(4)数据转换:将数据转换为易于进行数据挖掘的数据存储形式(5)数据挖掘:其作用是利用智能方法挖掘数据模式或规律知识(6)模式评估:其作用是根据一定评估标数据准,从数据挖掘结果中筛选出有意义的相关知识(7)知识表示:利用可视化和知识表达技术,向用户展示所挖掘的相关知识从商业应用的角度可以把整个数据挖掘过程描述为三个步骤:首先是数据收集,然后利用数据挖掘相关方法提取出有用的知识,最后以提取出来的知识来辅助相应决策者进行决策。2、计算均值、中位数、截断均值,并简单说明它们在反应数据中心方面的特点(P24-P25)(1)均值:是描述数据集的最常用的单个度量方法。但通常不是度量数据中心的最好方法。(2)中位数:对于倾斜的(非对称的)数据,中位数是数据中心的一个较好度量(3)截断均值:均值对极端值很敏感,截