1、01考试:大数据概述及基本概念1【单选 】 下列不属于商业大数据类型的是( ) A. 传统企业数据 B. 机器和传感器数据 C. 社交数据 D. 电子商务数据 A B C D 正确答案: D2【单选 】 信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。凡涉及到这些过程和技术的工作部门,都可称作( )部门 A. 技术 B. 研究 C. 信息 D. 管理 A B C D 正确答案: C3【单选 】 数据本身所承载的信息内容是指( ) A. 内容维度 B. 关系维度 C. 时空维度 D. 维度的交叉综合 A B C D 正确答案: A4【多选 】 大数
2、据平台的三个重要的技术部分有( ) A. 数据交易技术 B. 数据交互技术 C. 数据存储技术 D. 数据处理技术 A B C D 正确答案: A B D5【多选 】 互连网上出现的海量信息可以划分为三种,分别为( ) A. 结构化信息 B. 非结构化信息 C. 半结构化信息 D. 特殊化信息 A B C D 正确答案: A B C6【多选 】 “大数据 ”的特点是( ) A. 数据体量大 B. 数据类别大 C. 数据处理速度快 D. 数据真实性高 A B C D 正确答案: A B C D7【 判断 】 结构化数据是指不方便用数据库二维逻辑表来表现的数据( ) A. 正确 B. 错误 正确
3、错误 正确答案: 错误8【 判断 】 数据存储是大数据平台的根本。没有了存储平台,数据也就没有了载体( ) A. 正确 B. 错误 正确 错误 正确答案: 正确9【 判断 】 可视化是给机器看的,数据挖掘就是给人看的( ) A. 正确 B. 错误 正确 错误 正确答案: 错误10【 判断 】 全球数据的 90%产生于过去 2 年内( ) A. 正确 B. 错误 正确 错误 正确答案: 正确021【单选 】 以下不属于服务器及桌面虚拟化技术的是( ) A. x86 服务器虚拟化 B. 小型机分区技术 C. VDI 技术 D. 虚拟 SAN 技术 A B C D 正确答案: D2【单选 】 大数据
4、处理框架-Spark 诞生于( ) A. 伯克利大学 AMPLab B. Apache 孵化器项目 C. Apache 顶级项目 D. 开源项目 A B C D 正确答案: A3【单选 】 大数据的分析挖掘是( ),需要巨大的计算能力 A. 数据分散型计算 B. 信息分散型计算 C. 数据密集型计算 D. 信息密集型计算 A B C D 正确答案: C4【多选 】 SaaS 模式的优点有() A. 不用承担软件项目定制、开发、实施费用 B. 不用支付软件许可费用 C. 不需要支付采购服务器等硬件设备费用 D. 不需要支付购买操作系统、数据库等平台软件费用 A B C D 正确答案: A B C D5【多选 】 大数据处理框架-Spark 的优点是( ) A. Spark 是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合 B. Spark 不适用那种异步细粒度更新状态的应用 C. Spark 基于非实时数据流的数据处理 D. Spark 的适用面比较广泛且比较通用 A B C D 正确答案: A B D6【多选 】 能解决大数据存储效率的两方面有( ) A. 容量 B. 吞吐量 C. 数据大小 D. 网络带宽 A B C D 正确答案: A B7【 判断 】 使用单线程池模型来减少 task 启动开稍( )