1、系统工程师笔试题一、选择题(共 25 道)1、 操作系统在控制和管理进程过程中,涉及到( )这一重要数据结构,这是进程存在的唯一标识。A. FCB B. FIFO C. FDT D. PCB2、 在一个请求页式存储管理中。一个程序的页面走向为4、 3、2、1、3、5、4、3、2、1、5,并采用 LUR 算法。设分配给该程序的存储块数 M 分别为:3 和 4,在该访问中发生的缺页次数 F 和缺页率 f 是( )。A. M=3 ,F=8 、f67% M=4,F=5、f42% B. M=3,F=10、f=83% M=4 ,F=8 、f 67% C. M=3,F=9、f75% M=4 ,F=10、f
2、83% D. M=3,F=7、f58% M=4 ,F=6、f50%3、 通道是一种( )。A. I/O 端口 B. 数据通道 C. I/O 专用处理机 D. 软件工具4、 ( )是一种动态存储分配方式。A. 固定分区 B. 可变式分区 C. 简单分页管理 D. 请求分页管理5、 虚拟内存的容量只受( )的限制。A. 物理内存的大小 B. 磁盘空间的大小 C. 数据存放的实际地址 D. 计算机地址位数6、 现代操作系统的两个基本特征是( )和资源共享。A. 多道程序设计 B. 中断处理 C. 程序的并发执行 D. 实现分时与实时处理7、 若系统中有 5 台绘图仪,有多个进程均需使用两台,规定每个
3、进程一次仅允许申请一台,则至多允许( )个进程参与竞争,而不会发生死锁。A. 2 B. 3 C. 4 D. 58、 Windows 将遵循下面哪种搜索来定位 DLL?1 进程的当前工作目录 2 包含 EXE 文件的目录 3 列在 Path 环境变量中的一系列目录 4 Windows 系统目录5 Windows 目录A. 12453 B. 12543 C. 21453 D. 213459、 假定我们又三个程序,每个程序花费 80%的时间进行 I/O,20% 的时间使用 CPU,每个程序的启动时间和其需要使用 CPU 进行计算机的分钟数如表所示。请问在多线程/进程环境下,系统总响应时间为多少?程序
4、编号 启动时间 需要 CPU 时间(分钟)1 00:00 3.52 00:10 23 00:15 1.5A. 22.5 B. 23.5 C. 24.5 D. 25.510、 某主机安装了 2GB 内存,在其上运行的某支持 MMU 的 32 位 Linux 发型版中,一共运行了 X、Y、Z 三个进程,下面关于三个内存使用程序的方式,哪个是可行的?A. X、 Y、Z 的虚拟内存地址空间都能映射到 04G 虚拟地址上 B. X 在堆上分配的总大小为 1GB 的空间,Y 在堆上分配 200MB,Z 在堆上分配 500MB,并且内存映射访问一个 1GB 的磁盘文件C. X 在堆上分配 1GB,Y 在堆上
5、分配 800MB,Z 在堆上分配 400MBD. 以上的访问方式都是可行的11、 ( )命令组合起来能统计多少用户登录系统。A. who | wc -w B. who | wc -l C. who | wc -c D. who | wc12、 cron 后台常驻程序( daemon)用于( )。A. 负责文件在网络中的共享 B. 管理打印子系统 C. 跟踪管理系统信息和错误 D. 管理系统日常任务的调度13、一个文件的权限是-rw-rw-r-,这个文件所有者的权限是( )。A. read-only B. read-write C. write D. read-write-excute14、 I
6、BM 大数据平台和应用程序框架,( )以经济高效的方式分析 PB 级的结构化和非结构化信息。A. 流计算 B. Hadoop C. 数据仓库 D. 语境搜索15、大数据的价值是通过数据共享、( )后获取最大的数据价值。A. 算法共享B. 共享应用C. 数据交换D. 交叉复用16、大数据工程指大数据的( )的系统工程。A. 大数据网络发展和运营过程B. 规划建设运营管理C. 规律和验证D. 发现和验证17、规则 I-j,“有可能”,等于所有包含 I 的购物篮中同时包含 J 的购物篮的比例,为( )。A. 置信度B. 可信度C. 兴趣度D. 支持度18、 MapReduce 的 Map 函数产生很
7、多的( )。A. key B. value C. D. Hash19、( )程序负责 HDFS 数据存储。A. NameNodeB. JobtrackerC. DatanodeD. Tasktracker20、设有关系 R(S,D,M),其函数依赖集 F=SD,DM。则关系 R 至多满足( )。A. 1NFB. 2NFC. 3NFD. BCNF21、下列( )通常是集群的最主要瓶颈。A. CPUB. 网络C. 磁盘D. 内存22、 Thrashing 指的是( )。A. 非常频繁的换页活动B. 非常高的 CPU 执行活动C. 一个极长的执行过程D. 一个极大的虚拟内存法23、 Beladys
8、Anomaly 出现在( )。A. 内存管理算法B. 内存换页算法C. 预防死锁算法D. 磁盘调度算法24、关于 SecondaryNameNode 正确的是( )。A. 它是 NameNode 的热备B. 它对内存没有要求C. 它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间D. SecondaryNameNode 应与 NameNode 部署到一个节点25、并发控制的总体思想是( )。 A. 正确调度相冲突的操作 B. 对事务进行管理 C. 进行数据的更新 D. 有序的通信2、 简述题(共 2 题)1、 Hadoop 集群可以运行的 3 个模式分别是什么,都
9、有哪些注意点?2、 NoSQL 数据库是什么意思 ?为什么要使用和不使用 NoSQL 数据库? 列出 NoSQL 数据库的几个优点?3、 综合设计题(共 2 题)1、 提供 40 亿个不重复的 unsigned int 的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那 40 亿个数当中?2、 某监管部门需要更新内部数据存储系统。根据其业务需求,每日将产生的数据量峰值为1 亿条,每条数据大小约为 0.5KB,现在需要将过往几年的历史数据和持续产生的实时数据迁移到新的集群架构中,使得其具有高的读写性能和较高的分析效率。根据以上需求设计出适合的分布式存储系统架构(需注明所需设备的硬件参数)。