ImageVerifierCode 换一换
格式:DOCX , 页数:34 ,大小:4.64MB ,
资源ID:3154895      下载积分:20 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-3154895.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(IBM-SPSS-Modeler-教程-(1).docx)为本站会员(11****ws)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

IBM-SPSS-Modeler-教程-(1).docx

1、IBM SPSS Modeler 说明数据挖掘和建模数据挖掘是一个深入您的业务数据,以发现隐藏的模式和关系的过程。数据挖掘解决了一个常见的问题:您拥有的数据越多,就越难有效地分析并得出数据的意义,并且耗时也越长。金矿无法开采,通常是由于缺乏人力、时间或专业技术。数据挖掘使用清晰的业务流程和强大的分析技术,快速、彻底地探索大量的数据,抽取并为您提供有用且有价值的信息,这正是您所需要的“商务智能”。尽管您数据中的这些以前未知的模式和关系本身很有趣,但一切并不止于此。如果您可以使用这些过去行为的模式来预测未来可能发生的事情,那又会怎样?这就是建模的目标 - 模型,它包含一组从源数据中抽取的规则、公式

2、或方程式,并允许您通过它们生成预测结果。这正是预测分析的核心。关于预测分析预测分析是一个业务流程,其中包含一组相关技术,通过从您的数据中总结出有关当前状况与未来事件的可靠结论,帮助制定有效的行动措施。它是以下方面的组合: 高级分析 决策优化高级分析使用多种工具和技术,分析过去与现在的事件,并预测未来的结果。决策优化确定您的哪些措施可以产生最好的可能结果,并确保这些建议措施能够最有效地融入到您的业务流程中。有关预测分析如何工作的深入信息,请访问公司网站http:/ SPSS Modeler 为每种类别提供了一些示例: Classification 关联 细分(有时称为“聚类”)分类模型 使用一个

3、或多个输入字段的值来预测一个或多个输出(或目标)字段的值。这些技术的部分示例为:决策树(C&R 树、QUEST、CHAID 和 C5.0 算法)、回归(线性、logistic、广义线性和 Cox 回归算法)、神经网络、Support Vector Machine (SVM) 和贝叶斯网络。关联模型 查找您数据中的模式,其中一个或多个实体(如事件、购买或属性)与一个或多个其他实体相关联。这些模型构建定义这些关系的规则集。数据中的字段可以作为输入和目标。您可以手动查找这些关联,但关联规则算法可以更快速地完成,并能探索更多复杂的模式。Apriori 和 Carma 模型是使用此类算法的示例。另一种类

4、型的关联模型是序列检测模型,后者可以在按时间建立结构的数据中查找顺序模式。细分模型 将数据划分为具有类似输入字段模式的记录段或聚类。细分模型只对输入字段感兴趣,没有输出或目标字段的概念。细分模型的示例为 Kohonen 网络、K-Means 聚类、两步聚类和异常检测等。我如何知道使用哪种技术?有这样种类繁多的技术摆在面前,很难知道从哪里开始解决您的特定问题。幸运的是,IBM SPSS Modeler 可以通过自动化建模形式替您做出其中的部分决定。这是一种功能强大的技术,它能评估和比较多种不同建模方法,并按有效性顺序对它们进行排序。这样,您可以在单次建模运行中尝试多种方法。自动建模使用说明要启动

5、该应用程序,请从 Windows“开始”菜单的 SPSS Inc 程序组中选择 IBM SPSS Modeler 14.1。几秒钟后,屏幕上将显示主窗口。在数据挖掘过程中的每一个阶段,均可通过 IBM SPSS Modeler 易于使用的界面来邀请特定业务的专家。建模算法(如预测、分类、细分和关联检测)可确保得到强大而准确的模型。模型结果可以方便地部署和读入到数据库、IBM SPSS Statistics 和各种其他应用程序中。使用 SPSS Modeler 即处理数据的三个步骤。 首先,将数据读入 SPSS Modeler, 然后,然后通过一系列操纵运行数据, 最后,将数据发送到目标位置。这

6、一操作序列称为数据流,因为数据以一条条记录的形式,从数据源开始,依次经过各种操纵,最终到达目标(模型或某种数据输出)流工作区是 IBM SPSS Modeler 窗口的最大区域,也是您构建和操纵数据流的位置。通过在界面的主工作区中绘制与业务相关的数据操作图表来创建流。每个操作都用一个图标或节点表示,这些节点通过流链接在一起,流表示数据在各个操作之间的流动。在 SPSS Modeler 中,可以在同一流工作区或通过打开新的流工作区来一次处理多个流。会话期间,流存储在 SPSS Modeler 窗口右上角的“流”管理器中。IBM SPSS Modeler 中的大部分数据和建模工具位于节点选项板中,

7、该选项板位于流工作区下方窗口的底部。例如,可以使用“记录选项”选项板选项卡中包含的节点对数据记录执行操作,如选择、合并和追加等。要将节点添加到工作区,请在节点选项板中双击图标或将其拖放到工作区。随后可将各个图标连接以创建一个表示数据流动的流。每个选项板选项卡均包含一组不同的流操作阶段中使用的相关节点,如: 源。此类节点可将数据引入 SPSS Modeler。 记录选项。此类节点可对数据记录执行操作,如选择、合并和追加等。 字段选项。此类节点可对数据字段执行操作,如过滤、导出新字段和确定给定字段的测量级别等。 图形。此类节点可在建模前后以图表形式显示数据。图形包括散点图、直方图、网络节点和评估图

8、表。 建模。此类节点可使用 SPSS Modeler 中提供的建模算法,如神经网络、决策树、聚类算法和数据排序等。 数据库建模。 节点使用 Microsoft SQL Server、IBM DB2 和 Oracle 数据库中可用的建模算法。 输出。节点生成可在 SPSS Modeler 中查看的数据、图表和模型等多种输出结果。 导出。节点生成可在外部应用程序(如 IBM SPSS Data Collection 或 Excel)中查看的多种输出。 SPSS Statistics。 节点将数据导入 IBM SPSS Statistics 或从中导出数据,以及运行 SPSS Statistics

9、过程。随着对 SPSS Modeler 的熟悉,您也可以自定义供自己使用的选项板内容。可以使用“流”选项卡打开、重命名、保存和删除在会话中创建的流。“输出”选项卡中包含由 IBM SPSS Modeler 中的流操作生成的各类文件,如图形和表格。您可以显示、保存、重命名和关闭此选项上列出的表格、图形和报告。“模型”选项卡是管理器选项卡中功能最强大的选项卡。该选项卡中包含所有模型块,这些模型块包含针对当前会话在 SPSS Modeler 中生成的模型。这些模型可以直接从“模型”选项卡上浏览或将其添加到工作区的流中。窗口右侧底部是工程工具,用于创建和管理数据挖掘工程(与数据挖掘任务相关的文件组)。

10、有两种方式可查看您在 IBM SPSS Modeler 中创建的工程 - 类视图或 CRISP-DM 视图。依据“跨行业数据挖掘过程标准”,这一业内认可且无所属的方法理论,“CRISP-DM”选项卡提供了一种组织工程的方式。不论是有经验的数据挖掘人员还是新手,使用 CRISP-DM 工具都会使您事半功倍。“类”选项卡提供了一种在 SPSS Modeler 中按类别(即,按照所创建对象的类别)组织您工作的方式。此视图在获取数据、流、模型的详尽目录时十分有用。IBM SPSS Modeler 中最常见的鼠标用法如下所示: 单击。使用鼠标左键或右键选择菜单选项,打开上下文相关菜单以及访问其他各种标准

11、控件和选项。单击并按住按键可移动和拖动节点。 双击。双击鼠标左键可将节点置于流工作区并编辑现有节点。 中键单击。单击鼠标中键并拖动光标可在流工作区中连接节点。双击鼠标中键可断开某个节点的连接。如果没有三键鼠标,可在单击并拖动鼠标时通过按 Alt 键来模拟此功能。建模简介模型是一组规则、公式或方程式,可以用它们根据一组输入或变量来预测输出。例如,一家财务机构可根据对过往申请人的已知信息,使用模型预测贷款申请人可能存在优良还是不良风险。能够预测结果是预测性分析的中心目标,并且了解建模过程是使用 IBM SPSS Modeler 的关键。本示例使用决策树模型,该模型使用一系列决策规则对记录进行分类(

12、并预测响应),例如:如果收入 = 中等并且卡 “优良”本示例使用 CHAID(卡方自动交互效应检测)模型时,旨在进行常规的介绍,大部分概念会广泛应用于 SPSS Modeler 中的其他建模类型。无论要了解哪种模型,均需要首先了解进入该模型的数据。此示例中的数据包含有关银行客户的信息。其中使用了下列字段:字段名 描述字段名 描述Credit_rating 信用评价:0=不良,1=优良,9=丢失值年龄 Age in years收入 收入水平:1=低,2=中,3=高Credit_cards 持有的信用卡数量:1=少于五张,2=五张或更多教育 教育程度:1=高中,2=大学Car_loans 贷款的汽

13、车数量:1=没有或一辆,2=超过两辆银行可维护一个包含银行贷款客户历史信息,包括这些客户是正在还贷(信用评价 = 优良)还是在拖欠贷款(信用评价 = 不良)的数据库。银行希望使用现有的数据建立一个模型,允许他们预测未来贷款申请人拖欠贷款的可能性。使用决策树模型,您可分析两组客户的特征,并预测拖欠贷款的可能性。本示例使用了名为 modelingintro.str 的流,该流位于 streams 子文件夹下的 Demos 文件夹中。数据文件是 tree_credit.sav。请参阅 主题 Demos 文件夹 详细信息。我们来看一下流。 从主菜单中选择下列选项:文件 打开流 单击“打开”对话框的工具

14、栏上的金色模型块图标,然后选择 Demos 文件夹。 双击 streams 文件夹。 双击名为 modelingintro.str 的文件。构建流要构建流以创建模型,至少需要三个元素: 一个从某些外部源读取数据的源节点,在本示例中为 IBM SPSS Statistics 数据文件。 一个指定字段属性的源节点或“类型”节点,字段属性包括测量级别(字段包含的数据类型)以及每个字段在建模过程中的角色是目标还是输入等。 一个在运行流时生成模型块的建模节点。在本例中,我们使用 CHAID 建模节点。CHAID,或卡方自动交互效应检测,是一种通过使用称作卡方统计量的特定统计类型识别决策树中的最优分割来构

15、建决策树的分类方法。如果在源节点中指定了测量级别,则可以去掉单独的“类型”节点。从功能上来说,结果是一样的。该流中还包含“表”节点和“分析”节点,创建模型块并将其添加到流中后,将使用这两个节点查看评分结果。Statistics 文件源节点从 tree_credit.sav 数据文件读取 SPSS Statistics 格式数据,该文件安装在Demos 文件夹中。(名为 $CLEO_DEMOS 的特殊变量用于引用位于当前 IBM SPSS Modeler 安装下的该文件。这样,无论当前的安装文件夹或版本是什么,均可以确保路径有效。)类型节点指定每个字段的测量级别。测量级别是一种指示字段中数据类型

16、的类别。我们的源数据文件使用三种不同的测量级别。连续字段(例如 年龄 字段)包含连续的数字值,而名义字段(例如 信用评价 字段)有两个或多个不同值,例如 不良 、 优良 或 无信用历史 。有序字段(例如 收入水平 字段)用于描述具有顺序固定的不同值的数据,在本例中为 低 、 中 和 高 。对于每个字段,类型节点还指定角色,以指示每个字段在建模中扮演的部分。将字段 信用评价 的角色设置为 目标 ,此字段指示指定的客户是否拖欠贷款。这是目标,或者是要预测其值的字段。对于其他字段,将角色设置为 输入 。输入字段有时也称为预测变量,或建模算法用其值来预测目标字段值的字段。CHAID 建模节点生成模型。在建模节点的“字段”选项卡中,已选中使用预定义角色,这意味着将按在类型节点中的指定使用目标和输入。我们可以在此处更改字段角色,但本例中我们不做任何更改使用这些角色。 单击“构建选项”选项卡。

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。