1、数据挖掘与应用实验报告6 到 11 章学 院 自动化 专 业 物联网工程 年级班别 2015 物联网 4 班 学 号 3115001492 学生姓名 张思明 指导教师 董延峰 实验 6 数据挖掘的基本数据分析一、实验目的(1) 熟悉基本数据分析的处理流程(2) 进一步熟练掌握 SPSS Modeler 工具的操作二、实验环境(1) 相关智能算法的基本原理(2) IBM SPSS Modeler 软件三、实验内容及步骤1、数据的质量探索(1)建立数据流a、创建“Statistics”节点,读入 telco.sav 数据。b、创建“类型”节点,说明各变量角色,其中“流失”为目标变量。c、创建“数据
2、审核 ”节点并连接在适当的位置,进入编辑界面,在“质量”选项卡下,选择检测方法为平均值的标准差。(2)结果输出2、基本描述分析(1)建立数据流,创建“统计量”节点。(2)设置相关参数a、设置“统计量 ”节点,在 “检查”中添加开通月数、基本费用、免费部分和无线费用。b、在“相关”中添加年龄、收入和家庭人数。c、在“相关选择 ”中选择 “按重要性定义相关强度” 。(3)结果3、绘制散点图(1)构建数据流,创建“图”节点。(2)设置参数a、编辑“图 ”节点b、在“X 字段”和“Y 字段”中分别选择“基本费用”和“年龄” 。将“交叉字段”中的“颜色”设置为“流失” ,不同颜色表示流失变量不同取值的样
3、本点。(3)结果输出4、两分类变量相关性的研究(1)设置相关参数。创建“网络”节点,在“字段”中选择“套餐类型”和“流失” ,设置线值为“绝对值” 。(2)结果输出5、变量重要性分析(1)窗口设置。创建“特征选择”节点,编辑,将“流失”添加到目标选项中,其他的全部作为输入。(2)结果输出总的图:实验 7 统计分析:逻辑回归一、实验目的SPSS Modeler 的 Logistic 回归的方法。(1) 了解和熟悉 SPSS Modeler 及其相关知识。(2) 掌握 SPSS Modeler 工具建立多项 Logistic 回归的方法。(3) 学会运用 SPSS Modeler 进行多项 Logistic 回归的内容。二、实验环境一台装有 SPSS Modeler 软件系统的计算机。三、实验内容及步骤1、构建多项 Logistic 回归数据流(1)通过“Statistics 文件”节点读入 Brand.sav。(2)数据流中添加“类型”节点。(3)在“建模”模块下选择“Logistic”节点连接在数据流中恰当的位置。(4)运行结果:2、设置相关参数(1)右击“类型”节点,将 x3 设置为目标,其他保持不变。(2)设置“Logistic”节点,在模型下, 将使用分区数据勾选为“无” ,采用的过程选择“多项式” , “多项式过程”中“方法”采用“进入法” ,其他保持不变。3、结果运行