精选优质文档-倾情为你奉上数据挖掘老师范围最简知识点第一章数据仓库:是一个 面向主题的, 集成的, 时变的, 非易失的 的数据集合数据挖掘:就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘分析方法:分类、估值、预言、相关性分组或关联规则、聚集、描述和可视化 数据挖掘的过程:第二章数据属性:是一个数据字段,表示数据对象的一个特征属性类别:标称的 二元的 序数的 数值的数据的中心趋势度量方法:均值、中位数、众数数据相似性和异度量方法:欧式距离:它是在m维空间中两个点之间的真实距离曼哈顿距离:切比雪夫距离:例子上下为一题闵可夫斯基距离:第三章数据预处理:是指在主要的处理以前对数据进行的一些处理。比如缺项,噪声(工资=-100),不匹配(年龄和出生日期不匹配),冗余等等。原因:l 不完备:丢失属性,缺少某个感兴趣的属性,或仅含累计值。l 噪声:包含
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。