天津商业大学08数据仓库与数据挖掘试卷.doc

上传人:11****ws 文档编号:2401412 上传时间:2019-05-11 格式:DOC 页数:2 大小:55.50KB
下载 相关 举报
天津商业大学08数据仓库与数据挖掘试卷.doc_第1页
第1页 / 共2页
天津商业大学08数据仓库与数据挖掘试卷.doc_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

1、 1 数据仓库与数据挖掘 一 、 选择 题 (每空 2 分,共 40 分) 1开展数据挖掘的基本目的是( ) 。 建立数据仓库 B. 帮助用户作决策 C. 从大量数据中提取有用信息 D. 对数据进行统计和分析 2建立 “ 数据仓库 ” 的目的主要是 ( )。 A规范管理数据 B.日常事务处理 C更新数据方便 D.联机分析与决策支持 3以下不是支持数据挖掘技术的基础有 ( )。 A数据加密技术 B.海量数据收集 C数据挖掘算法 D.强大的多处理器计算机 4. 人工神 经网络包括三个基本层,即输入层、( )和输出层。 A. 网络层 B. 神经元层 C. 基因层 D. 隐含层 5. 元数据是一种 (

2、 )数据。 A. 数据的原始版本 B. 数据仓库内存储的信息 C. 描述数据仓库的信息 D. 是数据集中的精简数据。 6 数据仓库上的业务处理称作 ( ) 。 A.联机事务处理 B.联机分析处理 C.联机输入处理 D.联机查询处理 7. 智能决策支持系统是 ( ) 的系统。 A. 决策支持系统与人工智能技术相结合 B. 决策支持系统与数据库系统相结合 C. 决策支持系统与范式理论相结合 D. 决策支持系统与事务处理系统相结合 8. 数据仓库和数据挖掘是作为 ( ) 出现的。 A. 两种相同的信息技术 B. 处理数据的方法 C. 两种独立的信息技术 D. 两种独立的信息存储技术 9. 某超市研究

3、销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题? ( )。 A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 10. 将原始数据进行集成、变换、 维度规约、数值规约是在以下哪个步骤的任务? ( ) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 11. 假设 12 个销售价格记录组已经排序如下: 5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时, 15 在第几个箱子内? ( ) A. 第一个 B. 第二个 C. 第三个 D

4、. 第四个 12. 数据仓 库是随着时间变化的 ,下面的描述不正确的是 ( ) A. 数据仓库随时间的变化不断增加新的数据内容 B. 捕捉到的新数据会覆盖原来的快照 C. 数据仓库随事件变化不断删去旧的数据内容 D. 数据仓库中包含大量的综合数据 ,这些综合数据会随着时间的变化不断地进行新综合 13. 下面关于数据粒度的描述不正确的是 :( )。 A. 粒度是指数据仓库小数据单元的详细程度和级别 B. 数据越详细 , 粒度就越小 , 级别也就越高 C. 数据综合度越高 , 粒度也就越大 , 级别也就越高 D. 粒度的具体划分将直接影响数 据仓库中的数据量以及查询质量 14. 决策树中不包含一下

5、哪种结点 ? ( ) A. 根结点( root node) B. 内部结点( internal node) C. 外部结点( external node) D. 叶结点( leaf node) 15数据集市的数据组织一般采用( )模型。 A星型模型 B雪花模型 C星网模型 D第三范式 16多维数据分析中,( )是使用户在多层数据中能通过导航信息而获得更多的细节性数据。 A切片分 析 B切块分析 C向下钻取 D旋转分析 17遗传算法的三个基本算子有( )。 A重复、配对、变异 B 选择 、交叉、变异 C繁殖、屏蔽、改良 D选择、配对、变化 18一个链接到许多权威站点的站点叫( )。 2 A权威

6、B中枢 C权威页面 D中枢页面 19神经网络中,神经元起了一个( )作用。 A决策作用 B分类作用 C判断作用 D简化作用 20 BACON 系统有( )个版本。 A 3 B 4 C 5 D 6 二 、 判断题 ( 每题 1 分,共 10 分。各题的答案只能是 “对 ”或 “错 ”,要求分别用 “”或 “”表示 ) 1 数据集市是一种更小、更集中的数据仓库,因此数据集市很容易升级成数据仓库。( ) 2 监视休眠数据分为三级:表格级休眠、列级休眠和行级休眠。( ) 3思考模 型属于静态数据分析,分析人员利用系统已有的多层次的综合路径层层细化,找出事实发生的原因。( ) 4 可拓变换包括:转换变换

7、、增加变换、删减变换和扩大变换。( ) 5 文本挖掘是从 大量文本数据中提取以前未知的、有用的、可理解的、可操作的知识的过程。( ) 6 发现学习有两种方式,数据驱动方式的公式发现和启发式驱动方式的概念发现。( ) 7 遗传算法是一种随机搜索方法,是高效的有方向的搜索。( ) 8 ID3 是将信息增益作为特征(属性)判别能力的度量。( ) 9 数据仓库分析与设计由需求分析、概念模型设计、逻辑模型设计和决策模型设计四个部分组成。( ) 10 数据挖掘是一个不断反馈的过程。( ) 三、 简答题 (共 25 分 ) 1 ( 5 分) 数据集市的定义及其与数据仓库的差别。 2 ( 6 分) OLAP

8、的十二准则。 3 ( 5 分) 数据仓库开发有哪些困难? 4 ( 4 分) 数据挖掘按挖掘对象分类有哪些 ? 5 ( 5 分) 数据仓库的决策支持包括哪些? 四、应用题 (共 25 分) 1 ( 10 分)对于 buy_computer 的决策树,请从下图的决策树中提取分类规则。 2 ( 5 分) 设全集 U 对某属性 A 的划分为: A=E1, E2, E3=( a, b, c),( d, e, f),( g) ,现有对A 的粗糙集 X=a, b, g,分别计算集合 X 的下近似 A-( X) 、上近似 A-( X) 、正域 POSA、负域 NGEA和边界 BNDA。 3 ( 10 分) 数据库有如下 4 个事务。设最小支持度为 50%,使用 Apriori 算法找出所有的频繁项目集。(要求画出候选集 C 和 L 频繁集的表格,并在最后写出所求的频繁 2-项集 和 频繁 3-项集 ) TID 项 T1 A, C, D T2 B, C, E T3 A, B, C, E T4 B, E

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 策划方案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。