1、1我们的大数据时代(一)单选题(每题 2 分)1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高2. 下列关于大数据的分析理念的说法中,错误的是(D)A. 在数据基础上倾向于全体数据而不是抽样数据B. 在分析方法上更注重相关分析我不是因果分析C. 在分析效果上更追究效率而不是绝对精确D. 在数据规模上强调相对数据而不是绝对数据3. 万维网之父是(C)A. 彼得德鲁克B. 舍恩伯格C. 蒂姆伯纳斯李D. 斯科特布朗4. 下列关于普查的缺点的说法中,正确的是(A ) 。A. 工作量较大,容易导致调查内容有限、产生重复
2、和遗漏现象B. 误差不易被控制C. 对样本的依赖性比较强D. 评测结果不够稳定5.下列关于聚类挖掘技术的说法中,错误的是(B ) 。A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B. 要求同类数据的内容相似度尽可能小C. 要求不同类数据的内容相似度尽可能小D. 与分类挖掘技术相似的是,都是要对数据进行分类处理6. 智慧城市的构建,不包含(C ) 。A. 数字城市B. 物联网C. 联网监控D. 云计算7.大数据的起源是(C) 。A. 金融B. 电信C. 互联网D. 公共管理8. 智慧城市的智慧之源是(C ) 。A. 数字城市B. 物联网C. 大数据D. 云计算9. 假设一
3、种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。2A. 因果;相关B. 相关;因果C. 并列;相关D. 因果;并列10. 下列关于数据交易市场的说法中,错误的是(C) 。A. 数据交易市场是大数据产业发展到一定程度的产物B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D. 数据交易市场是大数据资源化的必然产物11. 下列关于计算机存储容量单位的说法中,错误的是(C) 。A. 1KB1MB1GBB. 基本单位是字节(Byte)C. 一个汉字需要一个字节的存储空间D
4、. 一个字节能够容纳一个英文字符12. 当前大数据技术的基础是由(C )首先提出的。A. 微软B. 百度C. 谷歌D. 阿里巴巴13. 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D) 。A. 美国B. 日本C. 中国D. 韩国14. 下列演示方式中,不属于传统统计图方式的是(D) 。A. 柱状图B. 饼状图C. 曲线图D. 网络图15. 当前社会中,最为突出的大数据环境是(A ) 。A. 互联网B. 物联网C. 综合国力D. 自然资源16. 可以对大数据进行深度分析的平台工具是(C ) 。A. 传统的机器学习和数据分析工具B. 第二代机器学习工具C. 第三代机器学习工
5、具D. 未来机器学习工具17. 智能健康手环的应用开发,体现了(D )的数据采集技术的应用。A. 统计报表B. 网络爬虫C. API 接口D. 传感器18. 过一系列处理,在基本保持原始数据完整性的基础上,减小数据规模的是(C) 。A. 数据清洗3B. 数据融合C. 数据规约D. 数据挖掘19. 制成大数据业务的基础是(A ) 。A. 数据科学B. 数据应用C. 数据硬件D. 数据人才20. 面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是(A) 。A. 大数据解决方案模式B. 大数据信息分类模式C. 大数据处理服务模式
6、D. 大数据资源提供模式21. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B) 。A. 在数据基础上倾向于全体数据而不是抽样数据B. 在分析方法上更注重相关分析而不是因果分析C. 在分析效果上更追究效率而不是绝对精确D. 在数据规模上强调相对数据而不是绝对数据22. 数据仓库的最终目的是(D ) 。A. 收集业务需求B. 建立数据仓库逻辑模型C. 开发数据仓库的应用分析D. 为用户和业务部门提供决策支持23. 大数据的最显著特征是(A ) 。A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度
7、高24. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C) 。A. 数据管理人员B. 数据分析员C. 研究科学家D. 软件开发工程师25. 下列论据中,能够支撑“大数据唔多不能”的观点的是(A) 。A. 互联网金融打破了传统的观念和行为B. 大数据存在泡沫C. 大数据具有非常高的成本D. 个人隐私泄露与信息安全担忧多选题(每题 3 分)26. 下列各国大数据发展路径的描述中,对应关系正确的是(ACDE) 。A. 日本:走尖端 IT 路线B. 英国:视大数据为新的自然资源C. 韩国:重视基础、首都先行4D. 印度:以 IT 外包转型为突破口E. 澳
8、大利亚: 原则先行、谨慎发展27. 当前,大数据产业发展的特点是(BCE) 。A. 规模较大B. 规模较小C. 增速很快D. 增速缓慢E. 多产业交叉融合28. 下列关于大数据的说法中,错误的是(AD) 。A. 大数据具有体量大、结构单一、时效性强的特征B. 处理大数据需采用新型计算机架构和智能算法等新技术C. 大数据的应用注重相关分析而不是因果分析D. 大数据的应用注重因果分析而不是相关分析E. 大数据的目的在于发现新的知识与洞察并进行科学决策29. 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(ABC) 。A. 传统营销模式比基于大数据的营销模式投入更小B. 传统营销模式比
9、基于大数据的营销模式针对性更强C. 传统营销模式比基于大数据的营销模式转化率低D. 基于大数据的营销模式比传统营销模式实时性更强E. 基于大数据的营销模式比传统营销模式标准性更强30. 按照服务目的不同,数据流通平台可分为(CDE) 。A. 政府数据开放平台B. 企业数据开放平台C. 数据交易市场D. 数据研发市场E. 数据废弃交易市场31. 下列论据中,能够支撑“大数据唔多不能”的观点的是(ADE) 。A. 互联网金融打破了传统的观念和行为B. 大数据存在泡沫C. 大数据具有非常高的成本D. 大数据医疗正在走进平民百姓E. 数据资产型企业前景光明32. 大数据的价值体现在(ABCDE) 。A
10、. 大数据给思维方式带来了冲击B. 大数据为政策制定提供科学依据C. 大数据助力智慧城市提升公共服务水平D. 大数据实现了精准营销E. 大数据的发力点在于预测33. 当前大数据技术的基础包括(ABD) 。A. 分布式文件系统B. 分布式并行计算C. 关系型数据库D. 分布式数据库E. 非关系型数据库34. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面的作用是(BD) 。A. 能够直观反映成对数据之间的空间关系5B. 能够主观反映多维数据之间的空间关系C. 能够静态演化事物的变化及变化的规律D. 能够动态演化事物的变化及变化的规律E. 提供高性能并行计算技术的强力支撑35. 下列关
11、于计算机存贮容量单位换算关系的公式中,正确的是() 。A. 1KB=1012ByteB. 1KB=1024ByteC. 1GB=1024KBD. 1GB=1012MBE. 1GB=1024MB判断题(每题 2 分)36. 第三方数据处理模式表现为:服务商通过软件即服务或平台即服务云服务形式为用户提供自己的数据上传到服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果。 ()37. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息精确。 ()38. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同最好集中处理。 ()39.
12、在美国的大数据大棋中, “五眼”是指配合美国进行全球监控的包含美国、英国、加拿大、荷兰在内的五个国家。 ()40. 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。 ()41.当前,企业提供的大数据解决方案大多基于 Ha doop 开源项目。 ()42. 澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府。 ()43. 大数据可以分析与挖掘出之前人们不知道或者没有注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值。 ()44.数据资产型企业产品线的盈利,主要通过提供收费服务来获取。 ()45.在大数据的范
13、畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行为特征,充分挖掘大数据的价值,变数据为资产。 ()(二)单选题(每题 2 分)1、当前大数据技术的基础是由( C)首先提出的。 A:微软 B:百度 C:谷歌 6D:阿里巴巴2、大数据的起源是(C )。 A:金融 B:电信 C:互联网 D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。 A:规模 B:活性 C:关联度 D:颗粒度5、数据清洗的方
14、法不包括(D)。 A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。 A:统计报表 B:网络爬虫 C:API接口 D:传感器7、下列关于数据重组的说法中,错误的是( A)。 A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含( C)。A:数字城市 B:物联网 C:联网监控 D:云计算9、大数据的最显著特征是( A)。 A:数据规模大 B:数据类型多样 C:数据处理速度快
15、D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B )。A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 7C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。 A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A )。 A:互联网 B:物联网 C:综合国力 D:自然资源13、在数据生命周期管理实践
16、中,( B)是执行方法。 A:数据存储和备份规范 B:数据管理和维护 C:数据价值发觉和利用 D:数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是( C)。 A:网络公司能够捕捉到用户在其网站上的所有行为 B:用户离散的交互痕迹能够为企业提升服务质量提供参考 C:数字轨迹用完即自动删除 D:用户的隐私安全很难得以规范保护15、下列关于计算机存储容量单位的说法中,错误的是( C)。 A:1KB1MB1GB B:基本单位是字节(Byte) C:一个汉字需要一个字节的存储空间 D:一个字节能够容纳一个英文字符,16、下列关于聚类挖掘技术的说法中,错误的是(B )。 (单选题,本题2分)
17、 A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B:要求同类数据的内容相似度尽可能小 C:要求不同类数据的内容相似度尽可能小 D:与分类挖掘技术相似的是,都是要对数据进行分类处理17、 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是( D)。A:美国 B:日本 C:中国 D:韩国18、下列关于大数据的分析理念的说法中,错误的是(D )。 A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据19、万维网之父是( C)。 A:彼得德
18、鲁克 B:舍恩伯格 C:蒂姆伯纳斯李 8D:斯科特布朗20、Mac OS系统的开发者是(C )。 A:微软公司 B:惠普公司 C:苹果公司 D:IBM 公司21、大数据时代,数据使用的关键是( D)。 A:数据收集 B:数据存储 C:数据分析 D:数据再利用22、下列关于数据交易市场的说法中,错误的是( C)。 A:数据交易市场是大数据产业发展到一定程度的产物 B:商业化的数据交易活动催生了多方参与的第三方数据交易市场 C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D:数据交易市场是大数据资源化的必然产物23、下列论据中,能够支撑“大数据无所不能”的观点的是( A)。 A:
19、互联网金融打破了传统的观念和行为 B:大数据存在泡沫 C:大数据具有非常高的成本 D:个人隐私泄露与信息安全担忧24、数据仓库的最终目的是(D )。 A:收集业务需求 B:建立数据仓库逻辑模型 C:开发数据仓库的应用分析 D:为用户和业务部门提供决策支持25、 支撑大数据业务的基础是( B)。 A:数据科学 B:数据应用 C:数据硬件 D:数据人才多选题(每题 3 分)26、在网络爬虫的爬行策略中,应用最为基础的是(AB )。 A:深度优先遍历策略 B:广度优先遍历策略 C:高度优先遍历策略 D:反向链接策略 E:大站优先策略27、当前,大数据产业发展的特点是(ACE )。 A:规模较大 B:
20、规模较小 C:增速很快 D:增速缓慢 E:多产业交叉融合28、下列关于数据生命周期管理的核心认识中,正确的是(ABC )。 A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段 9B:在不同的数据存在阶段,数据的价值是不同的 C:根据数据价值的不同应该对数据采取不同的管理策略 D:数据生命周期管理旨在产生效益的同时,降低生产成本 E:数据生命周期管理最终关注的是社会效益29、下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( AB)。 A:传统营销模式比基于大数据的营销模式投入更小 B:传统营销模式比基于大数据的营销模式针对性更强 C:传统营销模式比基于大数据的营销模式转
21、化率低 D:基于大数据的营销模式比传统营销模式实时性更强 E:基于大数据的营销模式比传统营销模式精准性更强30、下列关于脏数据的说法中,正确的是( ABCDE)。A:格式不规范 B:编码不统一 C:意义不明确 D:与实际业务关系不大 E:数据不完整31、数据再利用的意义在于( ABC)。 A:挖掘数据的潜在价值 B:实现数据重组的创新价值 C:利用数据可扩展性拓宽业务领域 D:优化存储设备,降低设备成本 E:提高社会效益,优化社会管理32、按照涉及自变量的多少,可以将回归分析分为(CD )。 A:线性回归分析 B:非线性回归分析 C:一元回归分析 D:多元回归分析 E:综合回归分析33、传统数
22、据密集型行业积极探索和布局大数据应用的表现是( BCE)。 A:投资入股互联网电商行业 B:打通多源跨域数据 C:提高分析挖掘能力 D:自行开发数据产品 E:实现科学决策与运营34、大数据人才整体上需要具备(ABE )等核心知识。A:数学与统计知识 B:计算机相关知识 C:马克思主义哲学知识 D:市场运营管理知识 E:在特定业务领域的知识35、下列关于大数据的说法中,错误的是(AD )。 A:大数据具有体量大、结构单一、时效性强的特征 B:处理大数据需采用新型计算架构和智能算法等新技术 C:大数据的应用注重相关分析而不是因果分析 D:大数据的应用注重因果分析而不是相关分析 E:大数据的目的在于
23、发现新的知识与洞察并进行科学决策10判断题(每题 2 分)36、在噪声数据中,波动数据比离群点数据偏离整体水平更大。( F) 37、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。( F)38、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(T ) 39、 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本
24、要求。(F ) 40、谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。( F) 41、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。( T)42、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。( F)43、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。( F) 44、啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(F ) 45、对于企业来说
25、,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。( F) (三)单选题(每题2分)1、 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) 。A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高2、 下列关于大数据的分析理念的说法中,错误的是(D)A. 在数据基础上倾向于全体数据而不是抽样数据B. 在分析方法上更注重相关分析而不是因果分析C. 在分析效果上更追究效率而不是觉得精准D. 在数据规模上强调相对数据而不是绝对数据3、 当前大数据技术的基础是由(C)首先提出的。A. 微软B. 百度C. 谷歌D. 阿里巴巴4、 下列关于大数据预测的说法中,错误的是(D) 。