计算机系统结构复习试题及答案(非计算).doc

上传人:sk****8 文档编号:3123174 上传时间:2019-05-22 格式:DOC 页数:52 大小:498KB
下载 相关 举报
计算机系统结构复习试题及答案(非计算).doc_第1页
第1页 / 共52页
计算机系统结构复习试题及答案(非计算).doc_第2页
第2页 / 共52页
计算机系统结构复习试题及答案(非计算).doc_第3页
第3页 / 共52页
计算机系统结构复习试题及答案(非计算).doc_第4页
第4页 / 共52页
计算机系统结构复习试题及答案(非计算).doc_第5页
第5页 / 共52页
点击查看更多>>
资源描述

1、文档仅作学习交流用,毋用做其他用途- 1 -一 名词解释 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为 透明性。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的 计算机。同构型多处理机系统:由多个同类型或至少担负同等功能的处理机组成,它们同时处理同一作业中能并行执行的多个任务。堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。

2、 数据相关:考虑两条指令 i 和 j,i 在 j 的前面,如果下述条件之一成立,则称指令 j 与指令 i 数据相关: (1)指令 j 使用指令 i 产生的结果; (2)指令 j 与指令 k 数据相关,而指令 k 又与指令 i 数据相关。 定向:用来解决写后读冲突的。在发生写后读相关的情况下,在计算结果尚未出来之前,后 面等待使用该结果的指令并不见得是马上就要用该结果。如果能够将该计算结果从其产生的 地方直接送到其它指令需要它的地方,那么就可以避免停顿。 向量处理机: 指令级并行:简称 ILP。是指指令之间存在的一种并行性,利用它,计算机可以并行执行两 条或两条以上的指令。 指令的动态调度:是指

3、在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重 新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。 指令的静态调度:是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序 执行的过程中、而是在编译期间进行代码调度和优化的。 失效率:CPU 访存时,在一级存储器中找不到所需信息的概率。 失效开销:CPU 向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。 强制性失效:当第一次访问一个块时,该块不在 Cache 中,需要从下一级存储器中调入 Cache, 这就是强制性失效。 容量失效:如果程序在执行时,所需要的块不能全部调入 Cache

4、 中,则当某些块被替换后又 重新被访问,就会产生失效,这种失效就称作容量失效。 冲突失效:在组相联或直接映象 Cache 中,若太多的块映象到同一组(块)中,则会出现该 组中某个块被别的块替换(即使别的组或块有空闲位置) ,然后又被重新访问的情况。RAID:廉价磁盘冗余阵列或独立磁盘冗余阵列。 通道:专门负责整个计算机系统输入/输出工作的专用处理机,能执行有限的一组输入输出 指令。 通道流量:指一个通道在数据传送期间,单位时间内能够传送的数据量。 互连网络:一种由开关元件按照一定的拓扑结构和控制方式构成的网络,用来实现计算机系 统中结点之间的相互连接。在拓扑上,互连网络是输入结点到输出结点之间

5、的一组互连或映 象。 分布式共享多处理机:它的共享存储器分布在各台处理机中,每台处理机都文档仅作学习交流用,毋用做其他用途- 2 -带有自己的本地 存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又 合在一起统一编址, 在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络 连接在一起 ,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处 理机存储器单元中的 “远程存储器” 。 机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或 异构的独立计算机通过高性能网络或局域网互连在一起,协同完成特定的并行计算任务。从 用户的

6、角度来看,机群就是一个单一、集中的计算资源。 二 填空 1.单机和多机系统中并行性发展的技术途径有:(时间重叠) 、 (资源重复) 、(资源共享)。 2.软件兼容有(向上兼容)、(向下兼容)、(向前兼容)和(向后兼容)四种其中(向后兼容)是软 件兼容的根本特征。 3.说出三种对计算机发展非常关键的实现技术(动态随机访问存储器) 、 (磁盘) 、 (网络) 。 4.同构型和异构型多处理机所采用的提高并行性的技术分别是 5.从处理数据的角度,并行性等级可以分为字串位串、 (字串位并) 、 (字并位串) 、和全并行。 6.从执行程序的角度看,并行性等级可以分为:(指令内部并行) 、 (指令级并行)

7、、 (任务级 或过程级并行)和作业或程序级并行。 7.计算机系统中提高并行性的技术途径有(时间重叠) 、 (资源重复)和(资源共享)三种。 在高性能单处理机的发展中,起主导作用的是(时间重叠原理) 。8.根据 CPU 内部存储单元类型,可将指令集结构分为(堆栈型)指令集结构、(累加器型) 指令结构、 (通用寄存器型)指令集结构。 9.在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现 (名)相关,否则就有可能出现(名相关) 、 (数据相关)和(控制)相关。 10.流水线中的相关有(数据)相关、 (名)相关、 (控制)相关三种。11.数据相关有三种,分别是:(写后读)

8、 、 (读后写)和(写后写) 。 12.对向量的处理有(水平处理)方式、 (垂直处理)方式、 (分组处理)方式。 13.存储器层次结构设计技术的基本依据是程序的(访问的局部性原理) 。 14.在存储层次中映像规则有 15.在存储层次中,常用的替换算法有(随机法) 、 (先进先出法) 、 (最近最少使用法) 。 16.设有一个“Cache-主存”层次,Cache 为4 块,主存为8 块;试分析对于以下2 种情况, 计算访存块地址为5 时的索引(index) 。 1):组相连,每组两块:索引为 2)直接映像:索引为 17.地址映像方法有(直接映像) 、 (组相连映像)和(全相连映像)等三中,其中(

9、全相连) 的冲突率最低。 18.按照产生失效的原因不同,Cache 失效可以分为(强制性失效) 、 (容量失效)和(冲突失 效)三种。 文档仅作学习交流用,毋用做其他用途- 3 -19.2:1Cache 经验规则是指大小为 N 的(直接映像)Cache 的失效率约等于大小为1/2 的(两 路组相连)Cache 的失效率。 20.相连度越高, (冲突)失效就越少:(强制性)失效不受 Cache 容量的影响,但(容量) 失效却随着容量的增加而减少。 (强制性失效和容量失效不受相连度的影响) 21.在虚拟存储器中,一般采用(全相连)地址映像方法和(LRU)更新策略。22.设计 I/O 系统的单个标准

10、()、()和()。23.输入/输出系统包括(外部设备(I/O 设备,辅助存储器) )和(其与主机之间的控制部分) 。 24.通道分为(字节多路)通道、 (选择)通道和(数组多路)通道三种类型。 三 简答题 1.什么叫软件兼容?软件兼容有哪几种?其中哪一种是软件兼容的根本特征?软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算 机上运行。差别只是执行时间的不同。 向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。 向后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能运行 于在它之后(前)投入市场的计算机。 向后

11、兼容是一定要保证的,它是系列机的根本特征。 2.计算机体系结构设计和分析中最常使用的三条基本原则是什么?并说出它们的含义。 以经常性事件为重点:对经常发生的情况进行优化,使分配更多的资源,达到更高的性能或 者分配更多的电能。 Amdahl 定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部 件的执行事件占系统中总执行事件的百分比。 程序的局部性原理:程序执行时所访问的存储器地址分布不是随机的,而是 相对的簇聚。 3.在进行计算机系统设计时,一个设计者应该考虑哪些因素对设计的影响? 在进行计算机系统设计时,设计者应该考虑到如下三个方面因素的影响: 技术的发展趋势; 计算机使用的发展趋势

12、; 计算机价格的发展趋势。 4.从执行程序的角度看,并行等级从低到高可分为哪几级? 从执行程序的角度来看,并行性等级从低到高可分为: (1)指令内部并行:单条指令中各微操作之间的并行; (2)指令级并行:并行执行两条或两条以上的指令; ( 3)线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个 线程为调度单位; (4)任务级或过程级并行:并行执行两个或两个以上的过程或任务(程序段) ,以子程 序或进程为调度单元; (5)作业或程序级并行:并行执行两个或两个以上的作业或程序。 5.从处理数据的角度,并行性等级从低到高可分为哪几级? 从处理数据的角度来看,并行性等级从低到高可分

13、为: (1)字串位串:每次只对一个字的一位进行处理。这是最基本的串行处理方式,不存 在并行性; (2)字串位并:同时对一个字的全部位进行处理,不同字之间是串行的。已开始出现 并行性; (3)字并位串:同时对许多字的同一位(称为位片)进行处理。这种方式具有较高的 并行性; (4)全并行:同时对许多字的全部位或部分位进行处理。这是最高一级的并行。 文档仅作学习交流用,毋用做其他用途- 4 -6.试以系列机为例,说明计算机体系结构、计算机组成和计算机实现三者之间的关系。 如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构。确 定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计

14、算机组成。选择存储芯片类型、 微组装技术、线路设计等属于计算机实现。 计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种 体系结构可以有多种组成。一种组成可以有多种实现。 7.从目的、技术途径、组成、分工方式、工作方式等5 个方面对同构型多处理机异构型多处 理机做一比较(列表) 。8.指令集结构设计中表示寻址方式的主要方法有哪些?简述这些方法的优缺点。 表示寻址方式有两种常用的方法:(1)将寻址方式编于操作码中,由操作码在描述指令 的同时也描述了相应的寻址方式。这种方式译码快,但操作码和寻址方式的结合不仅增加了 指令的条数,导致了指令的多样性,而且增加了 CPU 对指

15、令译码的难度。 (2)为每个操作数 设置一个地址描述符,由该地址描述符表示相应操作数的寻址方式。这种方式译码较慢,但 操作码和寻址独立,易于指令扩展。9.在指令集结构设计中,应考虑哪些主要问题? 在进行指令机结构设计中,应该考虑如下主要问题: 指令集功能设计:主要有 RISC 和 CISC 两种技术发展方向; 寻址方式的设计:设置寻址方式可以通过对基准程序进行测试统计,察看各种寻址方式的使 用频度,根据适用频度设置相应必要的寻址方式; 操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有,浮点数据类型(可以 采用 IEEE 754 标准) 、整型数据类型(8 位、16 位、 32 位的

16、表示方法) 、字符型(8 位) 、十 进制数据类型(压缩十进制和非压缩十进制数据表示)等等。 寻址方式的表示:可以将寻址方式编码与操作码中,也可将寻址方式作为一个单独的域来表 示。 指令集格式的设计:有固定长度编码方式、可变长编码方式和混合编码方式三种选择。 10.计算机指令集结构设计所涉及的内容有哪些? 答: (1) 指令集功能设计:主要有 RISC 和 CISC 两种技术发展方向; (2) 寻址方式的 设计:设置寻址方式可以通过对基准程序进行测试统计,察看各种寻址方式的使用频率,根 据适用频率设置必要的寻址方式。 (3) 操作数表示和操作数类型:主要的操作数类型和操 作数表示的选择有:浮点

17、数据类型、整型数据类型、字符型、十进制数据类型等等。 (4) 寻 址方式的表示:可以将寻址方式编码于操作码中,也可以将寻址方式作为一个单独的域来表 示。 (5) 指令集格式的设计:有变长编码格式、固定长度编码格式和混合型编码格式3 种。 11.RISC 指令集结构的设计原则是什么? 答(1) 选取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能应 尽可能简单,并在一个机器周期内完成;(3)所有指令长度均相同;(4)只有 Load 和 Store 操作指令才访问存储器,其它指令操作均在寄存器之间进行; (5) 以简单有效的方式支持 高级语言。 12.表示寻址方式的主要方法有哪些?

18、简述这些方法的优缺点。 答:表示寻址方式有两种常用的方法:(1)将寻址方式编于操作码中,由操作码在描述 指令的同时也描述了相应的寻址方式。这种方式译码快,但操作码和寻址方式的结合不仅增 加了指令的条数,导致了指令的多样性,而且增加了 CPU 对指令译码的难度。 (2)为每个操 作数设置一个地址描述符,由该地址文档仅作学习交流用,毋用做其他用途- 5 -描述符表示相应操作数的寻址方式。这种方式译码较慢, 但操作码和寻址独立,易于指令扩展。 13.造成流水线断流的主要原因是哪三种相关?简述三种相关的基本思想。 数据相关,名相关,控制相关 数据相关:指令 j 使用指令 i 产生的结果,或者指令 j

19、与指令 k 数据相关, 指令 k 又与指令 i 书记相关。 名相关:两条指令使用相同的名,但他们之间并没有数据流动。 控制相关:由分支指令引起的,需要根据分支指令的执行结果来确定后续指令是否执行。 14.数据相关有哪几种类型?解决数据相关有哪些主要方法? 15.简述先行控制的基本思想。 答:先行控制技术是把缓冲技术和预处理技术相结合。缓冲技术是在工作速度不固定的 两个功能部件之间设置缓冲器,用以平滑它们的工作。预处理技术是指预取指令、对指令进 行加工以及预取操作数等。 采用先行控制方式的处理机内部设置多个缓冲站,用于平滑主存、指令分析部件、运算 器三者之间的工作。这样不仅使它们都能独立地工作,

20、充分忙碌而不用相互等待,而且使指 令分析部件和运算器分别能快速地取得指令和操作数,大幅度地提高指令的执行速度和部件 的效率。这些缓冲站都按先进先出的方式工作,而且都是由一组若干个能快速访问的存储单 元和相关的控制逻辑组成。 采用先行控制技术可以实现多条指令的重叠解释执行。 16.简述定向技术的基本思想。 定向:用来解决写后读冲突的。在发生写后读相关的情况下,在计算结果尚未出来之前,后 面等待使用该结果的指令并不见得是马上就要用该结果。如果能够将该计算结果从其产生的 地方直接送到其它指令需要它的地方,那么就可以避免停顿。 17.试举例说明 DLX 流水线中存在不能依靠定向技术解决的数据相关及其解

21、决方 法。 18.有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?(1) 水平处理方式:不适合对向量进行流水处理。 (2) 垂直处理方式:适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内, 使得流水线运算部件的输入、输出端直接与存储器相联,构成 MM 型的运算流水线。 (3) 分组处理方式:适合流水处理。可设长度为 n 的向量寄存器,使每组向量运算的源/目向 量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成 RR 型运算 流水线。 19.简述 Tomasulo 算法的基本思想。 答:核心思想是: 记录和检测指令相关,操作数一旦就绪就立即执行,把发生

22、 RAW 冲突的可能性减小到最少; 通过寄存器换名来消除 WAR 冲突和 WAW 冲突。寄存器换 名是通过保留站来实现,它保存等待流出和正在流出指令所需要的操作数。 基本思想:只要操作数有效,就将其取到保留站,避免指令流出时才到寄存器中取数据, 这就使得即将执行的指令从相应的保留站中取得操作数,而不是从寄存器中。指令的执行结 果也是直接送到等待数据的其它保留站中去。因而,对于连续的寄存器写,只有最后一个才 真正更新寄存器中的内容。一条指令流出时,存放操作数的寄存器名被换成为对应于该寄存 器保留站的名称(编号) 。 20.简述前瞻执行的基本思想。 对分支指令的结果进行猜测,并假设这个猜测总是对的

23、,然后按这个猜测结文档仅作学习交流用,毋用做其他用途- 6 -果继续取、流出 和执行后续的指令。只是执行指令的结果不是写回到寄存器或存储器,而是放到一个称为 ROB 的缓冲器中。等到相应的指令得到“确认” (即确实是应该执行的)后,才将结果写入 寄存器或存储器。 21.调度分支延迟指令有哪三种常用方法?它们各有什么优缺点。 从前调度:可以有效提高流水线性能,但分支必须不依赖于被调度的指令。 从目标处调度: 分支转移成功时,可以提高流水线性能,但由于复制指令, 可能加大程序空间。 从失败处调度:分支转移失败时,可以提高流水线性能。但如果分支转移成 功,必须保证被调度的指令对程序的执行没有影响。2

24、2.在 Tomasulo 算法中,进入”流出“段的条件是什么?对于浮点操作来说,要进行哪些动 作和记录工作? 进入“流出”段的条件:有空闲保留站 r 动作和记录工作:写出算法或者文字描述均可。 要点: (1)判断第一操作数是否就绪;如果是,就把操作数读到保留站,否则就把寄存器 状态表中的标识送给保留站。 (2)判断第二操作数是否就绪;如果是,就把操作数读到保 留站,否则就把寄存器状态表中的标识送给保留站。 (3)把保留站置为忙。 (4)把操作 码送保留站。 (5)把保留站号 r 送到与该指令的结果寄存器对应的寄存器状态表项。 23.简述“Cache主存”层次与“主存辅存”层次的区别。 存 储

25、层次 比较项目 “Cache主存”层次 “主存 辅存”层次 目的 为了弥补主存速度的不 足 为了弥补主存容量的不足 存储管理的实现 全部由专用硬件实现 主要由软件实现 访问速度的比值 (第一级比第二级) 几比一 几万比一 典型的块(页)大小 几十个字节 几百到几千个字节 CPU 对第二级的访问 方式 可直接访问 均通过第一级 不命中时 CPU 是否切 换 不切换 切换到其它进程 24.试从3C 失效的关系分析增加块大小对 Cache 性能的影响。降低失效率最简单的方法是增加块大小 。 (1)对于给定的 Cache 容量,当块大小增加( 从16 字节开始)时,失效率开始是下降,后来反而上升了。

26、(2) Cache 容 量越大,使失效率达到最低的块大小就越大。 导致上述失效率先下降后上升的原因,在于增加块大小会产生双重作用。一方面它减少了强 制性失效,因为局部性原理有两方面的含义:时间局部性和空间局部性,增加块大小利用了 空间局部性;另一方面,由于增加块大小会减少 Cache 中块的数目,所以有可能会增加冲突 失效。在 Cache 容量较小时,甚至还会增加容量失效。刚开始增加块大小时,由于块大小还 不是很大,上述的第一种作用超过第二种作用,从而使失效率下降。但等到块大小较大时, 第二种作用超过第一种作用,使失效率上升。 0 简述减小 Cache 失效开销的几种方法答:让 读失效优先于写

27、、写缓冲合并、请求字处理技术、非阻塞 Cache 或非锁定 Cache 技术、采用 二级Cache。 25.写出三级 Cache 的平均访问时间的公式。 解:平均访存时间 命中时间失效率失效开销 只有第 I 层失效时才会访问第 I1。 设三级 Cache 的命中率分别为 H L1、 H l2、 H L3, 失效率分别为 M l1、 M l2、 M L3,第三 级 Cache 的失效开销为 P L3。 平均访问时间 T A H L1 M l1 H l2 M l2 (H L3 M L3 P L3 ) 26.降低 Cache 失效率有哪几种方法?(至少写出5 种) (简述其基本思想。文档仅作学习交流

28、用,毋用做其他用途- 7 -) 答:常用的降低 Cache 失效率的方法有下面几种: (1) 增加 Cache 块大小。增加块大小利用了程序的空间局部性。 (2) 增加 Cache 的容量。 (3) 提高相联度,降低冲突失效。 (4) 伪相联 Cache,降低冲突失效。当对伪相联Cache 进行访问时,首先是按与直接 映象相同的方式进行访问。如果命中,则从相应的块中取出所访问的数据,送给 CPU,访 问结束。如果不命中,就将索引字段的最高位取反,然后按照新索引去寻找“伪相联组”中的 对应块。如果这一块的标识匹配,则称发生了“伪命中” 。否则,就访问下一级存储器。 (5) 硬件预取技术。在处理器

29、提出访问请求前预取指令和数据。 (6) 由编译器控制的预取,硬件预取的替代方法,在编译时加入预取的指令,在数据 被用到之前发出预取请求。 (7) 编译器优化,通过对软件的优化来降低失效率。(8) “牺牲”Cache。在 Cache 和其下一级存储器的数据通路之间增设一个全相联的 小 Cache,存放因冲突而被替换出去的那些块。每当发生不命中时,在访问下一级存储器之 前,先检查“牺牲”Cache 中是否含有所需的块。如果有,就将该块与 Cache 中某个块做交 换,把所需的块从“牺牲”Cache 调入Cache。 27.任写出三种降低 Cache 失效开销的方法,并简述其基本思想。 (简述减小C

30、ache 失效开销 的几种方法。 ) 答:让读失效优先于写、写缓冲合并、请求字处理技术、非阻塞 Cache 或非锁定 Cache 技术、采用二级 Cache。 28.任写出三种 Cache 的优化技术,并简述其基本思想。 29.请简述 I/O 系统设计的步骤。 30.通道分为哪三种类型?它们分别适合为那种外围设备服务?(试比较三种通道的优缺点 及适用场合。 )答:(1)字节多路通道。一种简单的共享通道,主要为多台低速或中速的外围设备服务。 (2)数组多路通道。适于为高速设备服务。 (3)选择通道。为多台高速外围设备(如磁盘 存储器等)服务的。 31.简述使用物理地址进行 DMA 存在的问题,及

31、其解决方法。 32.互联网络的主要特性参数有那几个? (1)网络规模:网络中结点的个数。它表示该网络所能连接的部件的数量。(2)结点度: 与结点相连接的边数(通道数) ,包括入度和出度。 (3)距离:对于网络中的任意两个结点, 从一个结点出发到另一个结点终止所需要跨越的边数的最小值。 (4)网络直径:网络中任意 两个结点之间距离的最大值。网络直径应当尽可能地小。 (5)结点之间的线长:两个结点之 间连线的长度,用米、千米等表示。 (6)等分宽度:当某一网络被切成相等的两半时,沿切 口的边数(通道数)的最小值称为通道等分宽度。 (7)对称性:从任何结点看到的拓扑结构 都是相同的网络称为对称网络。

32、 33.什么是多处理机的 Cache 一致性?解决多 Cache 一致性有哪几种方法?并简述这些方法。 34.目录协议中,Cache 块有哪三种状态? (1)共享:在一个或多个处理器上具有这个块的副本,且主存中的值是最新值(所有 Cache 均相同)。 (2)未缓冲:所有处理器的 Cache 都没有此块的副本。 (3)专有:仅有一个处理 器上有此块的副本,且已对此块进行了写操作,而主存的副本仍是旧的。这个处理器称为此 块的拥有者。 文档仅作学习交流用,毋用做其他用途- 8 -四 计算、设计、分析题1.有一条动态多功能流水线由 5 段组成,加法用 1、3、4、5 段,乘法用 1、2、5 段,第

33、2 段的时间为 2 t,其余各段的时间均为 t,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ,画出时空图,并计算其吞吐率、1)(iiiBA加速比和效率。解:首先,应选择适合于流水线工作的算法。对于本题,应先计算A1B 1、A 2B 2、A 3B 3 和 A4B 4;再计算(A 1B 1) (A2B 2)和(A 3B 3) (A4B 4);然后求总的结果。其次,画出完成该计算的时空图,如图所示,图中阴影部分表示该段在工作。由图可见,它在 18 个t 时间中,给出了 7 个结果。所以吞吐率为:tTP81如果不用流水线,由于一次求积需 3t,一次求和需 5t,

34、则产生上述 7 个结果共需(45+33)t =29 t。所以加速比为:该流水线的效率可由阴影区的面积和 5 个段总时空区的面积的比值求得:2. 动态多功能流水线由 6 个功能段组成,如下图: t 2 t t t1 2 3 4 5 t时 间 段 1 2 3 4 5 0 2 3 4 5 6 7 8 9 10 12 3 14 5 16 输入 A1B 2 3 AB4 A B C D AB CD ABAB CD ABCD A=1 B1 2 2C3 3 D=A4 B4CD 7 18 61.892tS23.014ES1 S2 S3 S4 S5 乘 法 加 法 S6 文档仅作学习交流用,毋用做其他用途- 9

35、-其中,S1、S4、S5 、S6 组成乘法流水线,S1、S2、S3 、S6 组成加法流水线,各个功能段时间均为 50ns,假设该流水线的输出结果可以直接返回输入端,而且设置有足够的缓冲寄存器,若以最快的方式用该流水计算: 51iizyx(1) 画出时空图;(2) 计算实际的吞吐率、加速比和效率。解:机器一共要做 10 次乘法,4 次加法。文档仅作学习交流用,毋用做其他用途- 10 -其他题一、 单选题(共 15 道试题, 共 60 分。 ) 1.关于非专用总线三种控制方式中, 下列叙述错误的是() 。 A.集中式定时查询, 所有部件共用同一条“总线忙” 线 B.集中式定时查询, 所有部件都用同

36、一条“总线请求” 线 C.集中式独立请求, 所有部件都用同一条“总线请求” 线 D.集中式串行链接, 所有部件都用同一条“总线请求” 线 选择: C 2.汇编语言源程序变换成机器语言目标程序是经()来实现的。 A.编译程序解释 B.汇编程序解释 C.编译程序翻译 D.汇编程序翻译 选择: D 3.计算机使用的语言是()。 A.专属软件范畴, 与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令选择: B 4.多端口存储器适合于连接() 。 A.紧耦合多处理机 B.松耦合多处理机 C.机数很多的处理机 D.机数可变的多处理机 选择: A 5.在系统结构设计中, 提高软件功能实现的比例会()。 A.提高解题速度 B.减少需要的存贮容量 C.提高系统的灵活性 D.提高系统的性能价格比 -选择: C 6.用户高级语言源程序中出现的读写(I/O)语句, 到读写操作全部完成, 需要通过()共同完成。 A.编译系统和操作系统 B.I/O 总线、 设备控制器和设备 C.操作系统和 I/O 设备硬件 D.编译系统、 操作系统软件和 I/O 总线, 设备控制器、 设备硬件等 选择: D 7.流水线的技术指标不包括()。 A.响应比 B.吞吐率 C.加速比 D.效率

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 精品笔记

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。