DSP讲座课件.ppt

举报
资源描述
DSP原理及应用,山东大学,刘忠国:liuzhg@sdu.edu.cn cellphone:18764171197 Tel:84192,成绩考核方式: 期末考试(闭卷70%)+平时成绩(30%),平时成绩包含: 考勤,作业,上课提问,两次小测验(第6,11周),关于考核,1、 《DSP原理与应用教程》 ★ 张卫宁 等编著,科学出版社出版。 2、《DSP原理及应用》 ★ 邹彦 等编著,电子工业出版社出版。 3、http://www.ti.com/: TMS320C64x-C64x+ DSP CPU and Instruction Set Reference Guide (Rev. J)-spru732j.pdf TMS320C54x DSP CPU and Peripherals Reference Set Volume 1_spru131g.pdf TMS320C54x DSP Reference Set Volume 2 Mnemonic Instruction Set_spru172c.pdf,,参考文献,第1章:DSP技术概要,目录 1.1 DSP系统和芯片的结构特点 1.2 DSP的发展概况及趋势 1.3 DSP芯片的分类、性能及其应用,数字信号处理概述,数字信号处理是利用计算机或专用处理设备,以数字的形式对信号进行分析、采集、合成、变换、滤波、估算、压缩、识别等加工处理,以便提取有用的信息并进行有效的传输与应用。,第1章:DSP技术概要,数字信号处理包括两个方面的内容:,(1)数字信号处理算法的研究,研究如何以最小的运算量和存储器的使用量来完成指定的任务,如FFT算法,语音和图像的压缩编码算法、信号的调制与解调和加密与解密算法、信道的辨识与均衡算法、自适应信号处理算法、非线性滤波算法、模式识别算法等等。算法是各种应用的理论基础。 (2) 数字信号处理系统的实现,研究如何利用各种硬件、软件或者硬件与软件结合的方式,更加灵活、高效、高计算精度、低成本、低功耗地实现各种数字信号处理系统。,数字信号处理器DSP(Digital Signal Processors)是一种用于数字信号处理的可编程微处理器。它的诞生与快速发展,使各种数字信号处理算法得以实时实现,为数字信号处理的研究和应用打开了新局面,提供了低成本的实际工作环境和应用平台,推动了新的理论和应用领域的发展。,1.1 DSP系统和芯片的结构特点,1.1.1 DSP系统的基本结构,,实时处理(Real-Time):数字信号处理与信号的输入和输出保持同步。 非实时处理(Non Real-Time):先对信号进行采样并存储,然后再对其进行处理。,DSP系统的处理过程:,① 预处理包含放大器和滤波器,放大器将传感器转后的电信号放大到合适的幅值,滤波器的作用是滤掉高于折叠频率的分量和噪声,以防止信号频谱的混叠;,② 经采样和A/D转换器,将滤波后的信号转换为数字信号x(n);,③ 数字信号处理器对x(n)进行处理,得数字信号y(n);,④ 经D/A转换器,将y(n)转换成模拟信号;,⑤ 经低通滤波器,滤除高频分量,得到平滑的模拟信号y(t)。,3、数字信号处理的实现方式,数字信号处理的实现是用硬件、软件或软硬结合的方法来实现各种算法。数字信号处理的实现一般有以下几种方法:,① 在通用计算机(PC机)上用软件(如Malab 、C语言、Fortran)实现,但速度慢,不适合实时数字信号处理,只用于算法的模拟;,② 在通用计算机系统中加入专用的加速处理机实现,用以增强运算能力和提高运算速度。不适合于嵌入式应用,专用性强,应用受到限制;,,③ 用单片机实现,用于不太复杂的数字信号处理。不适合于以乘法-累加运算为主的密集型DSP算法;,④ 用通用的可编程DSP芯片实现,具有可编程性和强大的处理能力,可完成复杂的数字信号处理的算法,在实时DSP领域中处于主导地位;,,⑤ 用专用的DSP芯片实现,可用在要求信号处理速度极快的特殊场合,如专用于FFT、数字滤波、卷积、相关算法的DSP芯片,相应的信号处理算法由内部硬件电路实现。用户无需编程,但专用性强,应用受到限制;,,⑥ 用基于通用DSP核的ASIC芯片实现。随着专用集成电路ASIC(Application  Specific Integrated Circuit)的广泛使用,可以将DSP的功能集成到ASlC中。一般说来,DSP核是通用DSP器件中的CPU部分,再配上用户所需的存储器(包括Cache、RAM、ROM、flash、EPROM)和外设(包括串口、并口、主机接口、DMA、定时器等),组成用户的ASIC。,第1章:DSP技术概要,1.1.2 DSP芯片的结构特点 ☆ 经典的DSP算法举例 求两序列信号h(n)、x(n)的卷积: 求两序列信号y(n)、x(n)的相关函数: 数字滤波器的数学表达式为 : 对信号进行快速傅立叶变换FFT : ☆数字信号处理的突出特点:ΣAi×Xi 、高速实时,,第1章:DSP技术概要,☆ DSP特别适合于数字信号处理的结构  1. 采用改进型哈佛结构 计算机的总线结构分为: 冯·诺依曼结构  哈佛结构,,冯·诺依曼结构,多数微处理器和单片机采用如图所示冯·诺依曼结构。,,结构特点: 程序和数据共用同一套总线,对程序和数据需要分时读写,执行速度慢,数据吞吐量低,计算机结构简单,不适于进行高速度的数字信号处理。,哈佛结构与特点,(a) 哈佛结构,(b) 改进型哈佛结构,程序、数据具有独立的存储空间,有独立的程序总线和数据总线,可同时对程序和数据进行寻址和读写访问,执行速度高,数据吞吐量大,计算机结构复杂,非常适于进行高速的数字信号处理。,第1章:DSP技术概要,DSP采用的是改进型哈佛总线结构,如上图(b)所示 改进之处主要体现在下列3点: 1)片内RAM可映像至数据空间,也可映像至程序空间。 2)片内ROM可映像至程序空间,也可映像至数据空间。 3)具有根装载(Bootloader)功能。,第1章:DSP技术概要,,TMS320C2000系列DSP的总线结构图,第1章:DSP技术概要,2.流水线操作 ☆指令的执行通常分为以下4个阶段: F:取指 Fetch D :译码 Decode O :取操作数 Operand X :执行 Execute,第1章:DSP技术概要,,,取指—译码— 取操作数— 执行 指令n-2,取指—译码—取操作数—执行 指令n-1,取指—译码—取操作数—执行 指令n,,,,☆采用冯·诺依曼结构的微处理器指令流如下图 CPU是在完成一条指令的全部4个操作阶段后再去执行另一条指令的,从时间上看是一种串行执行的过程,因此需要花费较多的CPU时钟周期。,,4*n个操作周期,第1章:DSP技术概要,☆ DSP采用多级流水线结构 所谓流水线操作就是将一条指令的不同阶段分配在连续的几个周期上,通过不同的硬件去完成指令的不同执行阶段(称为级)。,第1章:DSP技术概要,一个4级流水线的示意图如图1-6所示。虽然就一条指令而言,似乎要用4个时钟周期才能完成全部操作,但从多条指令的角度看,则可认为每条指令的运行时间是单周期。这样,就使指令的运行速度得到了很大提高。,第1章:DSP技术概要,3. 片内集成有硬件乘法器和乘加单元 DSP内集成了乘加单元,从硬件结构上为高速完成卷积、相关、FFT及数字滤波等信号处理算法提供了基础。 TMS320C54x系列DSP内集成了17×17位硬件乘法器,和40位的加法器。,TMS320C54x系列乘加单元,第1章:DSP技术概要,TMS320C6000系列片内有2个硬件乘法器,支持在单周期内完成下列乘法运算。 16位×16位 16位×32位 双16位×16位 4个8位×8位,,C64x CPU,Data Path 2,Data Path 1,Register File A,D2,S2,L2,A31-A16,Instruction Decode,Instruction Dispatch,Instruction Fetch,Control Registers,Interrupt Control,,S1,L1,TMS320C64x -CPU,A15-A0,+,+,+,+,+,+,+,+,+,+,+,+,+,+,+,M1,x,D1,+,+,Register File B,B31-B16,B15-B0,,,,,,,,,,+,+,M2,,Advanced Instruction Packing,+,x,x,x,x,x,x,x,x,x,x,x,,,Advanced Emulation,,第1章:DSP技术概要,4. 功能强大的CPU结构 DSP的CPU一般包括:算术逻辑运算单元ALU、累加器、硬件乘法器、乘加单元、加法器、桶型移位器、程序地址产生和数据地址产生等部分。 例如:TMS320C6000采用双数据通道和8个功能单元的结构。CPU在单周期内可同时执行8条指令,具有超长指令字(VLIW)操作能力。,,,TMS320C64xCPU Core( 内核),第1章:DSP技术概要,5.硬件循环重复机制 许多DSP芯片具有指令重复循环的专用硬件及重复操作指令,能够自动重复执行单条或一段指令。 进入重复机制的指令会自动变为单周期指令,大大减少了执行时间. TMS320C5000中有重复计数器RPTC。当执行一条重复指令RPT #N时,会将重复值N送入RPTC,则紧接RPT后面的那条指令将被重复执行N+1次。每重复执行一次,RPTC的内容自动减1,直至减至零为止。这样可通过硬件自动完成循环操作过程。,,6. 复合操作指令,复合操作是指在一条单字单周期指令中可分别完成多个操作任务。由于DSP具有特殊的多总线哈佛结构和CPU硬件,综合了CISC和RISC的优点,大多数指令是复合指令。 以TMS320C24x的MPYA (乘且累加前次乘积)指令为例。 MPYA *+,AR3;设AR为AR1,执行后会发生下列事件: (1)(PC)+ 1 → PC (2) (ACC)+ 移位后的(PREG)→ ACC (3) (TREG)× (数据存储器)→ PREG (4) (AR1)+ 1 → AR1 (5) 令AR3为当前辅助寄存器AR (6) ARP=011b ,ARB=001b,改错,6. 复合操作指令 (P7 第二段) DSP执行该条指令仅需1个机器周期,但却完成了上述的6个操作。由此可见,DSP所采用的这种复合指令形式提高了CPU的效率,缩短了程序的执行时间。开发人员可以通过它们编写出高效率的汇编程序,但同时也对编程者提出了较高的要求。 7.嵌入式功能 DSP片内配置有大量片内外设,如图1-8所示。,第1章:DSP技术概要,7.嵌入式功能 DSP片内配置有大量片内外设,不用外扩很多器件,既可组成独立的应用系统。 DSP芯片具有强大的扩展接口能力,可有效连接一系列外扩器件。 DSP=数字信号处理能力+嵌入式功能,第1章:DSP技术概要,1.2 DSP的发展概况和趋势 1.2.1 DSP的发展概况 1978年,AMI( American Microsystem Inc.) 宣布第一个DSP S2811问世 1980年,日本NEC公司推出的D7720是第一片具有硬件乘法器的商用DSP 1982年,美国TI公司推出首枚低成本高性能的DSP-TMS32010芯片 90年代以来,数字信号处理器技术获得了惊人的发展 进入21世纪,ADI( Analog Device Instrument)公司推出主频600MHz的TS201浮点DSP,TI公司推出主频1GHz的TMS320C6416定点DSP 近年来,DSP在国内外应用市场上取得了长足进展,特别是在无线通信、宽带网络以及由此而拓展的流媒体应用领域都取得了重大突破。,第1章:DSP技术概要,☆目前全球DSP市场中的主要厂商 TI公司位居榜首,在全球DSP市场的占有率为44%左右 Motorola公司的占有率为13.2%左右 ADI公司的占有率为10.2%左右 其他一部分由 Hitachi、NEC、Zilog和 STMicroelectoncs等公司占据,第1章:DSP技术概要,高性能 无线基站 视频流、 视频会议 视频安防/监控制 医疗成像,☆ TI公司主推的三大DSP平台,,☆ C2000系列DSP子系列,C2xx子系列:16位定点DSP、20MIPS 代表器件:TMS320F206PZ C24x子系列:16位定点DSP、20MIPS 代表器件:TMS320F240 LF240x子系列:16位定点DSP、40MIPS 代表器件:TMS320LF2407 F28x子系列:32位定点DSP、150MIPS 代表器件:TMS320F2812、TMS320F2810,第1章:DSP技术概要,Optical Networking Control of laser diode,TV screen Deflection of electron beam for small angle and sharp corner TV screen,Automotive - EPS Battery operated precision for steering,Printer Print head control Paper path motor control,Digital Power Supply Provides control, sensing, PFC, and other functions,“Segway” Many new cool Application to come,Tire Pressure Low cost pressure sensing based on tire rotation speed measurement,,C2000系列DSP应用领域,第1章:DSP技术概要,,☆ C5000系列DSP子系列,C54x子系列:16位定点DSP、100~160MIPS 代表器件:TMS320VC5402、VC5409、VC5416 C55x子系列:16位定点DSP、400MIPS 代表器件:TMS320VC5510、VC5509、VC5502 C54x+ARM7子系列: 代表器件:TMS320VC5470、VC5471、DSC21 C55x+ARM9子系列: 即OMAP平台:Open Multimedia Applications Platform 代表器件:OMAP5910,第1章:DSP技术概要,,,C5000系列DSP的应用,第1章:DSP技术概要,,☆ C6000系列DSP子系列,C62x子系列:32位定点DSP、1200~2400MIPS 代表器件: TMS320C6205 代表器件: TMS320C6211 C64x子系列:32位定点DSP,4000~5760MIPS 代表器件: TMS320C6414、C6415、C6416 数字媒体器件:TMS320DM640、DM641、DM642 C67x子系列:32位浮点DSP、1200~1800MIPS, 900~1350MFLOPS 代表器件: TMS320C6701 代表器件: TMS320C6711、C6712、C6713,第1章:DSP技术概要,,C6000系列DSP的应用,第1章:DSP技术概要,第1章:DSP技术概要,☆目前TI公司和ADI公司的主流DSP的一些特性如表,第1章:DSP技术概要,1.2.2 DSP的发展趋势 1.单片DSP的发展 将围绕性能、价格和功耗这三大要素进行进一步的改善 2.DSP与其它可编程处理器技术相结合 将FPGA与DSP技术相结合,可实现宽带信号处理,大大提高信号处理速度 3.DSP与SoC(System on Chip)技术相结合 利用DSP核嵌入技术将一个系统集成在一块芯片上,提高设计速度,降低开发成本,可直接使用DSP系统开发技术来开发内部嵌有DSP内核的SoC.,DSP芯片性能发展比较,MIPS(Million Instructions Per Second) 每秒百万条指令,第1章:DSP技术概要,1.3  DSP芯片的分类、性能及其应用 1.3.1 DSP 芯片的分类 1. 按照数据格式分类 : 定点DSP芯片 浮点DSP芯片 2.按照芯片的用途分类:通用型DSP 专用型DSP 3.按照芯片结构分类:静态DSP在某种频率范围内任何频率都工作 为某种应用目的而专门设计的ASIC系统 硬连线逻辑电路或积木式结构,,,第1章:DSP技术概要,1.3.2 DSP芯片的性能 1.MIPS (Million Instructions Per Second) :百万条指令/每秒。 如TMS320C6416在时钟为1GHz时的峰值性能可达8000MIPS 2.MOPS (Million Operations Per Second :百万次操作/每秒。如TMS320C6201在时钟为200MHz时的峰值性能可达2400MOPS 3.MFLOPS (Million Float Operations Per Second :百万次浮点操作/每秒。如ADSP-TS201S的峰值性能可达14.4GFLOPS,,,第1章:DSP技术概要,1.3.2 DSP芯片的性能 4.MBPS(Million Bits Per Second):百万位/每秒 如TMS320C6000的总线时钟为200MHz时,其总线数据吞吐率为800M字节/秒 5.MAC执行时间:完成一次乘-累加运算所需时间 大部分DSP可在单周期内完成一次MAC 6.FFT执行时间完成一个N点FFT运算所需时间,第1章:DSP技术概要,1.3.3 DSP芯片的应用,作业,习题1.3-1.5,
展开阅读全文
相关搜索
温馨提示:
文客久久所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。

当前位置:首页 > 教育教学资料库 > 课件讲义


Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。