1、高等 算机系计 统结构清华大学计算机科学与技术系高性能计算研究所民 授郑纬 教2007年9月计算机科学与技术系研究生课程高等计算机系统结构第一章 高等计算机的核心技术并行处理第二章 加速比性能模型与可扩展性分析第三章 互连与通信第四章 划分与调度第五章 并行存储器系统第六章 Cache Coherence第七章 Memory Consistency第八章 指令级并行处理第九章 微处理器设计与实现方法第十章 网格计算高等计算机系统结构第十一章 DSM第十二章 传感器网络第十三章 对等计算第十四章 海量网络存储器第十五章 多核CPU技术第十六章 可信计算系统第十七章 虚拟化技术第十八章 基于集群的
2、海量数据处理第二章 加速比性能模型与可扩展性分析2.1 加速比性能分析2.1.1 一般 念概2.1.2 加速比2.1.3 三 加速比性能模型种2.2 可扩展性分析2.1 加速比性能模型2.1.1 一般概念1. 理机处 时间积理机 目 理 的乘处 数 与处 时间 积用以度量些 理机 行 的 源利用率。这 处 运 时 资若一程序在 P台 理机上 行的处 运 时间为Tp, 此则 P台 理机在处 Tp 隔 完成的时间间 内工作最大 量数 为Tp * P。可 理机 工作曲 的 分看将处 实际 线对时间 积成是 些 理机完成的这 处 有效工作量。效率 有效工作量 最大工作量之比。为 与2. 行度(并 De
3、gree Of ParallelismDOP)行度(并 DOP)是在一定 隔 行时间间 内执一 程序所用的 理机的 目。个 处 数3. 行性分布 并 图行一 定的程序执 个给 时DOP 的分布对时间。图DOP 的 隔之 即 理机要完与对应时间 间 积 为处成的工作或工作负载。下 所示 一图 为 个 行性分布并 图。DOPt1 tt2并行性分布图2.1.2 加速比1. 加速比绝对最好的串行算法 行算法相比将 与并 较.定 一( 具体机器有 )义 与 关 最好的串将行算法在一台上的 行 行算法在运 时间与并 N台 行的 相比。运 时间定 二( 具体机器无 )义 与 关 最好的串将行算法在最快的 序
4、机上的 行 行算顺 执 时间与并法在 行机上的 行 相比。并 运 时间T(N)TS best2.相 加速比对同一 行算法在 点上 行并 单节 运 时间与在多 相同 点 成的 理机系 上的个 节 构 处 统 运行 之比。时间定 重于描述算法和 行 算这种 义侧 并 计机本身的可 展性扩 。)()1(NTTS 性加速比:线 中 小,通信少,弱耦合 算间开销 计超 性加速比:线 用需要大 存 可能出当应 内 时 现病 加速比:态 加速比 ,可能是 算量太小递减 计2.1.3 三种加速比性能模型1.固定 加速比性能模型负载 Amdahl定律在 多 用 域, 算 的大小许 实时应 领 计 负载常固定。在 行机中,此 可分布至多并 负载台 行 行, 得的加速比并 执 获 称为fixed-load speedup。一 的 可表示如下:个问题 负载W = Ws + Wp其中,Ws代表 中不可 行化的串行部分问题 并 负载, Wp表示可 行化的部分 。并 负载则n 点情 下,加速比可以表示如下:个节 况nWpWsWpWsSn/