1、1多 DSP 系统技术研究摘要:随着 DSP 技术的发展,多 DSP 系统得到越来越广泛的应用,本文介绍了几种常用的多 DSP 系统结构,并分析了这些多 DSP 系统结构的特点和应用领域,为多 DSP 系统设计提供参考意见。 关键词:多 DSP 系统、并行处理; 中图分类号:F407.6 文献标识码:A 文章编号: 1、引言 随着数字技术的发展,对数字信号处理的要求也越来越高,特别是在国防科技领域,运算量大、处理流程复杂、实时性及与运算速率要求高,传统的以单个 DSP 构建的数字信号处理系统,已经难以满足数据处理的要求1。为此,在 DSP 中引入并行多处理器技术是必然趋势。 应用多个 DSP
2、设计成并行数据处理模块,多个模块间采用标准接口进行交互,为大型的数据处理系统提供了一种合适的解决方法2。 2、多 DSP 系统结构设计 多 DSP 系统可以按照需求灵活组成线型、并行、星型、环形、网格型或超立方型等多种结构,各个结构都有各自的特点和优缺点,选用什么体系结构都是根据应用需求而来的,不能一概而论。 对于线型结构,比较常用的是多个 DSP 串成一条流水线,如下图所2示: 图 2.1 线型结构 在线型结构中,每个 DSP 都从它的上一级接收数据,完成自己的处理,将处理结果发送给它的下一级,从最末一级 DSP 输出的数据就是最终结果了,线型结构比较简单,对于 DSP 之间的通信要求较低,
3、最容易实现,因而应用较多。 另外一个应用较多的系统结构是并行结构,如下图所示: 3图 2.2 并行结构 并行结构中,DSP 之间可以没有信息交互,DSP 之间可以独立工作,系统中还会有一个控制芯片(通常会是 FPGA) ,用于将数据发送给 DSP,同时将 DSP 的处理结果进行综合。 网格型结构是一种扩展性和并行性都比较好的结构,如图 2.4 所示是一个 4 片 DSP 组成的一个网格型结构,而多个网格型结构组合,就可以组成如 2.5 所示的一个超级网格结构。 图 2.3 网格型结构 图 2.4 超级网格结构 3、线型结构性能分析 4评价并行处理系统的关键的两个性能指标是:加速比和并行效率;而
4、这两个指标取决于组成并行处理机的三个要素:处理单元、并行处理系统的网络结构、并行算法程序和任务分配方法3。 在线行结构中,我们有如下的评定公式: (1) (2) 其中:为系统的加速比; 为系统的效率;N 为 DSP 的个数; 为每个DSP 的任务处理时间; 为最长的任务处理时间; 为 DSP 间的通信时间。 从上面的公式分析来看,对于线型结构来说,影响系统的加速比和效率的影响因素主要为:1)执行时间最长的任务处理时间 ;2)通信量和任务运算量的比值。当运算任务在 DSP 上平均分配的时候(时) ,线型系统可以获得最佳加速比和效率: 5(3) (4) 从上述公式来看,线型结构的加速比始终小于 1
5、,也就是线型结构无法加快运行速度;当处理器增加后,会减小,此时会变大,系统的加速比和效率反而会降低,因而线型结构不适合 DSP 太多的情况。 综上所述,线型结构是一种不太适合多 DSP 系统的体系结构,这种结构无法加快系统的运行速度,而且系统无法进行容错性设计,当系统中有一个 DSP 不工作,整个系统都会崩溃;这种线行结构的好处是可以提高系统的吞吐量,系统的处理能力还是可以得到提高,而且由于系统结构相对简单,任务分解简单,是一种最基本的多 DSP 系统结构,应用于 DSP 个数不多,DSP 外部接口资源不是很丰富的应用中。 4、并行结构性能分析 在并行结构中,我们有如下评定公式: (5) 6(
6、6) 同样在并行结构中,当任务在 DSP 上平均分配的时候,系统也可以获得最佳加速比和效率: (7) (8) 从上述公式来看,并行结构可以获得很好的加速比,DSP 个数 N 越多,系统的加速比越大,但是并行结构的加速比也不是能无限增加的,因为当 DSP 增多后,任务在多个 DSP 上平均分配会变得越来越困难,而且当DSP 增加后,也会变大,这时 DSP 间通信所耗的时间在运算中所占比例增加,可能会出现 DSP 个数增加了,但是系统的加速比反而下降的情况。并行结构的系统效率和 DSP 的个数无关,与 DSP 的通信量和运算量的比7值相关,通信的时间越长,系统的效率就越低。 并行结构除了有很好的加
7、速比外,还可以进行很好的容错性设计,比如可以将所有的 DSP 分为两组,两组 DSP 做同样的运算,最后将运算结果进行综合比较选取合适的取值,这样当一组 DSP 出现问题无法工作时,可以使用另外一组 DSP 进行工作,系统的容错性就可以提高一倍,当然此时系统的加速比和效率也会下降一倍,但是对于某些重要系统中,这种效率的牺牲所带来的容错性提高是非常有必要的。 并行结构为了达到最好的效率,对系统的要求也会比较高,首先任务在各个 DSP 上的分解的越平均越好,不要出现某个 DSP 上任务处理时间过长,否则会拖累整个系统的效率低下;另外为了更好的并行效果,DSP 最好有快速的外部接口以降低通信时间;同
8、时并行系统的控制要求也比较高,系统控制的复杂性会增加,一般这种并行系统的 DSP 个数也不会太多,应用场合多在算法的运行时间比较确定而且好分解的场合。 5、网格型结构性能分析 在3中给出了网格型结构的性能评价公式: (9) 8(10) 其中 r 是每个处理单元上子任务的运算量和通信量之比;为处理单元利用通信口传送一个数据的时间;为处理单元完成一次总线存取所需时间。 可见网格型结构的加速比依然和系统的 DSP 个数 N 成线性关系,系统效率与个数 N 无关,但是与 DSP 间的通信时间相关。 而对于超级网格结构这种系统,两个非直接相连的 DSP 之间无法直接进行数据交互,但是他们之间数据交换的时
9、间和其所经过的路径成正比关系,假设一个规则网络拓扑结构中平均路径为 n,则可以得到超级网格结构系统的加速比公式3: (11) 可以看到在这种情况下系统依然可以获得线性的加速比。 这种网格型结构或超级网格型结构是目前多 DSP 系统的重要研究方9向,也是最有挑战性的研究领域。在这种大规模的并行处理系统中,可重构能力和容错能力及其重要,数据的传递采用路由算法并具备防死锁能力,在某个处理单元出错时,能将出错单元的子任务移到其它处理单元,路由算法则能决定数据在两个处理器单元之间通过网络传递。另外,为防止通信堵塞和预防死锁,还可以引入虚拟通道技术,这样可以有效利用网络资源,使得链路通道不会因为其中一条通道的堵塞而影响其它的通信进程3。 6、结束语 当前,并行数字信号处理系统已经广泛应用于军用和商用领域。随着人们对系统更快需求的增长,并行多 DSP 系统会变得更加普遍,在市场上充满商机,应用领域无可限量。 参考文献: 1 李蛟,杨进,邱兆坤,基于 ADSP2TS201S 的多 DSP 并行数据处理系统设计J,现代电子技术,2010,19(15):42-46. 2鲍华, 刘冠男, 一种多 DSP 的并行数据处理系统设计及其实现, 中国集成电路, 2012, 6:54-58. 3白军元, 贺占庄.高速通用 DSP 的并行技术.微电子学与计算机, 2003,4:32-38.