精选优质文档-倾情为你奉上数据挖掘课设要求目标课程设计是在数据挖掘过程中加强理论和方法的系统方法和实践方法。 在“数据挖掘课程设计”中,提供了一些模拟的实际应用程序数据集,并计划了一些课程设计项目。 通过进行课程设计,学生将掌握以下技术:1.通过数据库技术处理实际的应用程序数据;2.具有基本监督学习方法的大数据挖掘步骤;3.评估分类器的策略;4.影响分类器性能的主要方面;5.解决数据挖掘中实际应用问题的主要工具。项目1:监督学习算法之间的比较1.数据集请参阅附属文件:adult.train,adult.test和adult.desctiption。adult.train文件用于训练,adult.test用于测试,adult.desctiption用于描述数据中的属性。数据缺少标为“?”的值2.任务(1)数据预处理。 将数据从文件迁移到oracle等数据库,然后通过数据库技术处理数据。 删除缺少值的元组。(2)利用训练数据建立预测模型。 基本的监督学习方法(例如朴素贝叶斯分类,ID3,C4.5,CART,BPAN