ImageVerifierCode 换一换
格式:DOC , 页数:6 ,大小:45.50KB ,
资源ID:4178751      下载积分:10 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-4178751.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(7563《数据挖掘与客户管理》期末考试卷A卷及答案.doc)为本站会员(丁**)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

7563《数据挖掘与客户管理》期末考试卷A卷及答案.doc

1、共 4 页,第 页1 试卷代号:7563 A 卷 浙江广播电视大学 2006 年 1 月期末考试试题 数据挖掘与客户管理期末考试试卷 (试卷总分:100 分,考试时间:120 分钟) 题号 一 二 三 四 总分 分数 一、名词解释(每题 4 分,共 20 分) 1数据挖掘: 2. 过度拟合: 3. 过抽样: 4辛普森差异系数(基尼系数): 5数据仓库: 共 4 页,第 页2 二、填空题(每空 2 分,共 30 分) 1. 数据挖掘的三大支柱分别是 、 和 。 2. 互动循环过程有四个业务过程,这四个过程循环往复,分别是理解业务问题、将数据 转换成可执行的决策、 和 。 3. 预测模型成功应用的

2、三个假定分别是 、 和 。 4. 数据仓库的优点是 和 。 5. 数据仓库可由多个数据中心构成,数据仓库设计者们安排好这些数据中心的最主要挑 战是要建立合适的 。 6. 使用无监督的数据挖掘方法必须 。 7. 为了确保输入数据早于输出结果,可以用 方法对数据时间 元素进行处理。 8. 分段输入组合模型和模型分段组合模型的最大区别在于 。 9. 客户流失的原因,大致可以分为两类:自愿流失和 。 三、单项选择题(每题 2 分,共 20 分) 1. 企业所建立的预测模型的好坏取决于模型在( )上的表现效果。 A 得分集 B 训练集 C 测试集 D 评价集 2. 客户在经济活动中具有多重身份,下面哪一

3、种不是其身份之一( )。 A 行为身份 B 所有权身份 C 学习身份 D 决策身份 3. 下列四条描述中,正确的一条是( )。 A 企业实施数据挖掘,必须要有数据仓库。 B 企业要实施数据挖掘最好的方式是请编外专家。 C 企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位 和所买来的现成模型设计之初的假设相吻合。 共 4 页,第 页3 D 在建模的时侯,增益最高的模型就是最好的模型。 4. 数据挖掘算法以( )形式来组织数据。 A 行 B 列 C 记录 D 表格 5. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( )。 A 数据越多越好。 B 尽可

4、能多的适合的数据。 C 得分集数据是建模集数据的一部分。 D 以上三条都正确。 6. K均值类别侦测要求输入的数据类型必须是( )。 A 整型 B 数值型 C 字符型 D 逻辑型 7. 在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益 图上的( )相对应。 A 线段长度 B 线段斜率 C 相对应的线段长度 D 相对应的线段斜率 8. 企业为提升每个客户的价值,应实现( )最优化。 A 促销活动 B 预算最优化 C 客户最优化 D 三者都不是 9. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了( )数据挖掘方法。 A 分类 B 预测 C 组合或关联法则 D 聚类

5、10. 企业成功实施数据挖掘, 需要以下( )知识或技术 A 预先的规划 B 对商业文体的理解 C 综合商业知识和技能 D 都需要 四、简答题(每题 6 分,共 30 分) 1. 数据挖掘的六种常用算法和技术分别是什么? 2. 实现数据挖掘技术在企业中专业化应用的四种有效途径? 共 4 页,第 页4 3. 一般认为有哪几种方法可以提升客户的价值? 4. 数据挖掘中的数据需要采用哪些格式? 5. 预测模型的建立过程有哪些? 共 4 页,第 页5 数据挖掘与客户管理期末考试试卷答案 (试卷总分:100 分,考试时间:120 分钟) 一、名词解释(每题 4 分,共 20 分) 1. 数据挖掘:是通过

6、自动或半自动化的工具对大量的数据进行探索和分析的过程,其 目的就是发现其中有意义的模式和规律。 2. 过度拟合:预测模型对训练集和测试集的模式记忆太深,而不能很好地、一般化地 对未来数据进行预测。 3. 过抽样:多抽取稀有事件,少抽取常见结果,以建立模型集的过程。目的是调整模 型集中稀疏数据与一般数据间的比例关系,使之保持在 15%-30%. 4. 辛普森差异系数(基尼系数):衡量度量总体的差异程度。解释为从总体中有放回 地随机取得两个样品属于不同类别的概率。公式为:2P1(1P1) ,其中 P1 是属于第 一类的概率。 5. 数据仓库:是从关系型数据库中发展起来的,是一个面向主题的、集成的、

7、反映历 史变化的和相对稳定的数据集合。 二、填空题(每空 2 分,共 30 分) 1. 数据挖掘技术与算法、 无所不在的数据、 建立有效的预测模型 2. 决策实施、 评价决策模型 3. 过去是将来的预言家、 数据是可以获得的、 数据中应包括我们的预期目标 4. 数据仓库是从一个点上观察整个企业,而不是许多小定义的“地下仓库”的拼凑集 合、 数据挖掘记录的是最令人感兴趣的详细的数据 5. 纬度和事实 6. 人机交互 7. 将时间范围附加到时间字段上 8. 数据的分段是预先知道的还是模型决定的 9. 非自愿流失 三、单项选择题(每题 2 分,共 20 分) 1. A 2. C 3. B 4. D

8、5. B 6. B 7. D 8. C 9. C 10. B 共 4 页,第 页6 四、简答题(每题 6 分,共 30 分) 1. 数据挖掘的六种常用算法和技术分别是什么? 分类:处理结果是离散的 估计:处理的是连续的结果 预测:任何的预测都可以被认为是分类或估计。不同之处在于你强调的是什么:可 以对分类后的结果加以检验;但在预测中,检验只能等待事物发生后才能确定。 组合或关联分析 聚类:其与分类的区别是聚类不依赖于事先确定好的组别。 描述与可视化:“女性比男性更支持民主党” 。 2. 实现数据挖掘技术在企业中专业化应用的四种有效途径? 购买与企业的商业问题配套的评分机制 购买数据挖掘软件这类

9、整体解决方案 聘请外部专家完成预测模型的建立 组织内部掌握数据挖掘技能 3. 一般认为有哪几种方法可以提升客户的价值? 一般认为,有如下三种方法可以提升客户的价值: 对客户已有产品,增添新功能,或者说提升产品的购买价值。 向客户出售更多、更容易升级的产品。 使客户能长期购买本公司的产品。 4. 数据挖掘中的数据需要采用哪些格式? 数据挖掘中的数据需要采用以下格式: 所有数据应该在一个表格/数据库视图中 每一行对应于与业务问题相关的一个案例 忽略具有单一值/几乎单一值的列 忽略所有行的值都不同的列 删除所有同义列 对于预测模型,目标列必须是可识别的 5. 预测模型的建立过程有哪些? 搜集建模所需的尽可能多的适合的数据,即搜集模型集数据; 建立训练集数据,用于建立预测模型; 建立测试集数据,用于预测模型的修正; 建立评价集数据,用于估计模型的效果,或不同模型的效果比较; 建立得分集数据,该数据不属于模型集的一部分,不知道这部分数据会产生什么样 的结果。

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。