1、 西安电子科技大学 何超电磁场数值分析考点 1: 矩量法的一般过程 (算子方程、 离散化过程、 选配过程、 矩阵方程求解) 。给定算子方程和基函数,采用伽略金法, 计算阻抗矩阵和激励电压矩阵,从而求得 电流系数矩阵 ,即得到 方程的近似解。 (矩阵维数一般为 22,或 33,便于计算) 。1http:/ 3 个矩量法例题考点 2:ScaLAPACK 的矩阵分布方式。给定进程网格 ,矩阵分块大小 ,要求能写出按 ScaLAPACK 矩阵分布方式,每个进程对应的矩阵元素。?1 并行矩阵填充 在 PC 集群系统中 MPI 并行矩量法研究 36 37考点 3: temporary block colu
2、mn 对 active block column 分解产生的影响.对于当前活动列块(即正在进行 LU 分解的列块) ,要能够分析其左侧临时列块对其 LU 分解所产生的影响。?英文书写得很详细了啊 45-55 有 lu 分解 将系数矩阵 A 转变成等价两个矩阵 L 和 U 的乘积 ,其中 L 和 U 分别是下三角和上三角矩阵。当 A的所有顺序主子式都不为 0 时,矩阵 A 可以分解为 A=LU,且当 L 的对角元全为 1 时分解唯一。其中 L是下三角矩阵,U 是上三角矩阵。 4 阶矩阵的 LU 分解 1高斯消元法 见数值分析 教材考点 4:积分方程的建立要求掌握 EFIE 、MFIF 、PMCH
3、W(电场、磁场、表面积分方程) 根据 等效原理建立的过程,即对于给定的问题(PEC (理想导体)或 介质)能根据等效原理建立积分方程(不要求写出场的位函数表达式,主要考察方程建立的思想) 。看矩量法的书 那个英文书只有 EFIE等效原理EFIE考点 5:RWG 基函数考察 RWG 基函数的 表达式,以及其 特点,对于给定的一个三角形网格图要能够标出哪些地方( 公共边上) 存在基函数。 书上都有啊RWG 基函数用共边的三角形对作为基本的面元形式,如图 2 所示,第 n 条边对应的电流基函数表示为 )6(022otherwisTrf nnAl nnAlnnn考点 6:解矩阵方程的迭代方法-CG 迭
4、代方法要求掌握 RCG 和 RPCG 的计算流程,二者中考一个。书上有啊 只有 RCG考点 7:并行性能评测Wall clock time 、并行加速比、并行效率、可扩展性。其中 Wall clock time由哪几部分时间 组成。时钟时间(墙上时钟时间wall clock time):从进程从开始运行到结束,时钟走过的时间,这其中包含了进程在阻塞和等待状态的时间。进程的三种状态为阻塞、就绪、运行。Wall clock time 由哪几部分时间组成 ? 时钟时间 阻塞时间 就绪时间 运行时间用户 CPU 时间 就是用户的进程获得了 CPU 资源以后,在用户态执行的时间。系统 CPU 时间 =
5、用户进程获得了 CPU 资源以后,在内核态的执行时间。用户 CPU 时间+系统 CPU 时间=运行时间。并行算法的评价方法 .1.加速比(speedup),是同一个任务在单处理器系统和并行处理器系统中运行消耗的时间的比率,Sp=T1/TpSp 是加速比,T1 是单处理器下的运行时间,Tp 是在有 P 个处理器并行系统中的运行时间。该评测指标,如果能够随着 P 保持一个线性的增长,则表示,多台机器能够很好的缩短所需时间2.并行效率也是评价并行性能的重要指标之一,它其实是“每个进程”的加速比:线性加速比相当于并行效率 p/p=1.0,通常,效率都小于 1。3.scaleup 可扩展性评测 scal
6、eup 的方法是,在扩大数据的同时,增加计算机的数目。scaleup 计算方法如下:scaleup(DB,m)=使用 1 台电脑在 DB 上运行算法使用的时间/使用 m 台电脑在 m*DB 上运行算法使用的时间。如果 scaleup 值随着 m 的改变,一直在 1.0 附近,或者更低,则表示该算法,对数据集的大小有很好的适应性。考点 8:并行矩量法的调优方法调优参数:Block size 、process grid 、in-core buffer(核外而言) 。要掌握一些基本的结论。 197-199 170-176出了矩量法基本原理 和积分方程那一块 可能没有 就说这些参数怎么影响性能的1 对
7、于 Intel CPU,当问题规模增加时, Block size 为 104 表现优于 Block size 为 112.2 The matrix solving time decreases to approximately 70% of the original time after the process grid is changed from 1*64 to 8*8. Using more CPU cores does not guarantee faster simulation unless the code is executed with a properly designed process grid.The choice of 2*32 process grid is better than the choice of the 4*16 process grid.The choice of the optimum process grid changes with the hardware configuration.