精选优质文档-倾情为你奉上必考知识点:信息增益算法/ ID3决策树(计算) (详细见教材)使用朴素贝叶斯分类预测类标号(计算)FP-TREE(问答) (详细见教材)数据仓库的设计(详见第二章)(问答) (见PPT)数值规约 Equi-depth、equi-width、v-optimal、maxdiff(问答) (详细见教材)BUC (这个也要考,但不记得怎么考的了)后向传播神经网络(名词解释)K-平均,K-中心点,DBSCAN解析特征化(这个也要考)总论数据挖掘:是从大量数据中发现有趣(非平凡的、隐含的、先前未知、潜在有用)模式,这些数据可以存放在数据库,数据仓库或其他信息存储中。挖掘流程:(1)学习应用域(2)目标数据创建集(3)数据清洗和预处理(4)数据规约和转换(5)选择数据挖掘函数(总结、分类、回归、关联、分类)(6)选择挖掘算法(7)找寻兴趣度模式(8)模式评估和知识展示(9)使用挖掘的知识概念/类描述:一种数据泛化形式,用汇总的、简洁的和精确的方法描述各个类和概念,通