1、DSP控制器原理及其应用主讲 宁改娣西安交通大学 电气学院,DSP 综述,第一部分:关于课程(课程简介)第二部分: DSP 基本概念DSP芯片分类DSP芯片的应用DSP与MCU硬件结构比较DSP芯片的选择DSP芯片的发展第三部分: TI公司DSP概述,数字信号处理技术(Digital Signal Processing,DSP):用数学方法对数字信号进行处理,处理包括变化或提取相应的信息经典的数字信号处理方法:时域:信号滤波FIR、IIR频域:频谱分析FFT数字信号处理的特点:AiXi高速实时数字信号处理器(Digital Signal Processor):用于实时完成数字信号处理的微处理器
2、。DSP:特指数字信号处理器,什么是DSP?,关于课程课程宗旨,传统的数字信号处理课程,主要讲授有关的理论和算法,基本上不讨论实现技术;DSP芯片厂家的技术手册则只介绍产品的功能和性能。两者比较脱节,都不大利于工程应用。我们开设这门课程的目的,就是希望将两者有机地结合起来,通过授课、实验缩短同学开发DSP系统的时间,培养学生的工程素质和创新能力。,先修课程(本课程),单片机原理或微型计算机原理数字信号处理技术(算法) (非必要)具备专业知识(应用于本专业领域的算法非必要),关于课程DSP课程特点,DSP简单说就是高性能处理器,归纳处理器课程的特点:理论性不强(犹如英语单词,无需溯源,软硬件都如
3、此)学习目的会用(最大限度发挥其作用)学习方法动手(练出来的,不是学出来的),处理器学习方法,微型计算机原理 20多年 8088/8086 学到什么?单片机原理 近20年 51系列学到什么?DSP原理 5年左右 F240/F2407/F2812变化大 DSP结构与实验开发环境都会略有变化类型多;更新换代快,处理器发展更新越来越快。如何学?不是学习某一具体芯片。学习处理器课程要掌握的就是基本技能基本功。,如何修炼基本功?,会找资料:充分利用网络资源(无所不有),提高查找资料能力会看:教材或 data sheets.(*.pdf文件)。一般了解和详细使用软件开发环境:熟悉一些仿真软件Keil51、
4、CCS等;找、看、用对比学习:( CPU、微控制器MCU、 DSP、嵌入式处理器)动手:软硬件设计,遇到问题先找自己,才能积累软硬件设计技能会借力:高手指点,是捷径;最好的教师是自己:自己动手才有收获,特别是工程应用课程!,设计中如何得到技术参考资料以及如何得到相关源码,1)原则是碰到问题就去在TI网站的搜索中用keyword搜索资料,主要要注意的就是Application Notes,user guides 比如不知道怎样进行VC5402的McBSP编程,搜McBSP和VC5402 如果不知道如何设计VC5402和TLV320AIC23的接口以及编程,搜TLV320AIC23和VC5402;
5、 这样可以搜到一堆的资料,这些资料一般均有PDF文档说明和相应的源程序包提供,download后做少许改动即可2)版上发问3)google搜索4)再不济,找技术支持,碰运气了,处理器工程应用(实战用),选型(DSP、MCU及具体型号);(靠只是储备)熟悉有关模块详细结构及编程方法;(C或汇编)熟悉开发软件(大多数是相通的);软件、硬件设计、调试、系统联调(调试功底相通)。,授课对象及学时安排,全校研究生公共课(电气工程、机械工程、生命科学、电子与信息工程、航空航天学院等) 20+20学时 电气学院、航空航天学院本科生 32+16学时特点:学生面广、基础不同数字信号处理技术课程掌握程度不同应用对
6、象不同(专业不同),主要内容,DSP课程 = 教学实验DSP课程教学内容以F240,学会学习处理器的方法(硬件结构、指令系统、开发)实验开设基本实验(统一安排)综合实验(时间开放)专题研究科研,实验开设实验室建设及资源,2001年建立DSP(F240)实验室2003年加入TI大学计划“研究生创新实验室”成立时,成为课程之一PCITDS510 18套 F240EVM 18套TMDXeZD2812 F2812DSK 15套闻亭2407 USB仿真器 5套TMDS3P701016A 2407 EVM 2套TMDS DSK 5416 15套TMDS DSK 5510 2套感谢的TI支持,上课及考核形式
7、,上课:多媒体讲课,许多内容需要自学参考书:DSP控制器原理及应用 宁改娣等编写 ,上课以此为主,包括实验内容 上datasheet及应用资料实验以你们为主进入实验前要明确你要干什么?掌握什么?(而非教师告诉你如何如何做?)自己设计综合实验(可以充分利用DSP现有资源,无需外加其他硬件)提供了目前最好的DSP开发仿真环境及实验环境考核开卷笔试30(实验教学内容)由大家上课和实验的态度决定是否考平时上课及实验40(验收课程设计结果)综合实验书面报告30(非常正规)。或者写一篇论文在核心期刊以上发表。,第一部分: DSP 基本概念,DSP芯片的分类,DSP芯片主要可以按照下列两种方式进行分类。按
8、数据格式分 定点DSP芯片 浮点DSP芯片 按用途分 通用型DSP芯片 专用型DSP芯片,DSP芯片的应用,(1) 信号处理如数字滤波、自适应滤波、快速傅立叶变换、相关运算、谱分析、卷积、模式匹配、加窗、波形产生等;(2) 通信如调制解调器、自适应均衡、数据加密、数据压缩、回波抵消、多路复用、传真、扩频通信、纠错编码、可视电话等;(3) 语音如语音编码、语音合成、语音识别、语音增强、说话人辨认、说话人确认、语音邮件、语音存储等;(4) 图形/图像如二维和三维图形处理、图像压缩与传输、图像增强、动画、机器人视觉等;,DSP芯片的应用,(5) 军事如保密通信、雷达处理、声纳处理、导航、导弹制导等;
9、(6) 仪器仪表如频谱分析、函数发生、锁相环、地震处理等;(7) 自动控制如引擎控制、声控、自动驾驶、机器人控制、磁盘控制等;(8) 医疗如助听、超声设备、诊断工具、病人监护等;(9) 家用电器如高保真音响、音乐合成、音调控制、玩具与游戏、数字电话/视等。,DSP的应用正在日益发展,PDA,巡航导弹,移动通信系统,80%的手机采用了TI的DSP Core,还可以举出很多例子,医院用的B超、CT、核磁共振,卫星遥感遥测,天气预报、地震预报、地震探矿,风洞试验,数字化士兵、数字化战争,.,DSP的应用领域取决于设计者的想象空间,DSP与MCU硬件结构比较,DSP(数字信号处理器)作为一种微处理器,
10、其设计的出发点和通用CPU以及MCU等处理器是不同的。DSP是为完成实时数字信号处理任务而设计的,算法的高效实现是DSP器件的设计核心。DSP在体系结构设计方面的很多考虑都可以追溯到算法自身的特点。,DSP与MCU硬件结构比较,改进的哈佛结构、多总线:片内多条数据、地址和控制总线,冯诺依曼结构 改进哈佛结构 多数CPU采用 几乎所有DSP 单片机哈佛结构:但共用一套AB和DB,由控制信号CS、DS区分,改进的哈佛结构,总线结构,多总线:片内多条数据、地址和控制总线。什么是总线? AB、DB、CB3总线单片机、8086/8088等微处理器片内、片外各有几条总线?,DSP与MCU硬件结构比较,改进
11、的哈佛结构、多总线:片内多条数据、地址和控制总线流水线技术:多个控制和运算部件并行工作,流水线操作(4级流水线),100,指令周期,101,102,103,104,105,106,顺序执行 ADD SUB ,TI流水线26级,CPUCLK 取指令 N N+1 N+2 N+3 译码 N-1 N N+1 N+2取操作数 N-2 N-1 N N+1执行 N-3 N-2 N-1 N图 四级流水线 C2的CPU运行于4级流水线方式,DSP与MCU硬件结构比较,改进的哈佛结构、多总线:片内多条数据、地址和控制总线流水线技术:多个控制和运算部件并行工作硬件乘法器特殊指令:MAC(连乘加指令,单周期同时完成乘
12、法和加法运算)RPTS和RPTB(硬件判断循环边界条件,避免破坏流水线)特殊寻址方式:位倒序寻址(实现FFT快速倒序)循环寻址特殊片内外设:可编程等待电路(便于与慢速设备接口)数字锁相电路 PLL(有利系统稳定)丰富片内外设:定时器、异步串口、同步串口、DMA控制器、A/D和通用I/O口、PWM、CAN等丰富片内存储器类型:RAM、DARAM、ROM、Flash、SARAM等,新的DSP芯片采用Cache(高速缓存)机制,解决存储器速度与DSP内核速度不匹配的问题,DSP与MCU硬件结构比较,需要说明的是:两者在不断融合,取其优势差异越来越不是那么明显,DSP与MCU软件开发比较,模块化:按功
13、能模块编程工程化:软硬人员分离,MCU:ORG xxxx,绝对定位优点:简单、容易上手 缺点:模块化编程差工程化不支持,DSP:Section:相对定位缺点:灵活、上手较难优点:模块编程好工程化编程支持,DSP软件开发,Section( “段”)概念:一块连续的储存空间,可存放程序或数据在编程时,“段”没有绝对定位,每个“段”都认为是从0地址开始的一块连续的储存空间,而无需关心这些“段”究竟定位在系统的哪些地方。优点:便于程序的模块化编程;便于工程化管理:可将软件开发人员和硬件开发人员基本上分离开。重定位:由于所有的“段”都是从0地址开始,所以程序编译完成后是无法运行的,要让程序正确运行,必须
14、对“段”进行重新定位,这个工作由链接器完成。.cmd文件:MEMORY命令描述系统硬件资源,SECTIONS命令描述软件人员程序中用到的“段”如何定位到恰当的硬件资源上。,DSP与MCU开发工具比较,MCU:代替方式(仿真头替代MCU)硬件时序为仿真器硬件时序,与目标系统时序有一定差异 或多或少占用目标硬件资源仿真头制作较难仿真电缆较短,使用不便不同MCU,工具不同,用户投资加重,DSP:接口方式(JTAG)硬件时序即为目标系统时序不占目标系统硬件资源仿真头制作方便仿真电缆较长,使用方便不同的DSP,仿真接口标准JTAG,工具相同,用户投资有保障,DSP与MCU硬件开发比较,MCU硬件开发基本
15、功可以移植到DSP开发DSP处理速度一般稍高,注意高速PCB制作事项,DSP芯片的选择(选择顺序按情况定),1. DSP 芯片的运算速度(各厂商)2. DSP 芯片的价格3. DSP 芯片的硬件资源(存储器、ADC、PWM等等)4. DSP 芯片运算精度5. DSP 芯片开发工具: 软件 硬件6. DSP 芯片功耗7. 其他:封装、应用场合(民品,工业品,军品)、售后服务 TI DSP的选型主要考虑处理速度、功耗、程序存储器和数据存储器的容量、片内的资源,如定时器的数量、I/O口数量、中断数量、DMA通道数等。DSP的主要供应商有TI,ADI,Motorola,Lucent和Zilog等,其中
16、TI占有最大的市场份额。(先入为主),DSP芯片的发展(1),1978年AMI公司推出S2811世界上第一片DSP ;1979年INTEL公司推出2920DSP芯片的一个重要 里程碑; 1980年NEC公司推出PD7720第一片具有乘法器的DSP芯片;1982年TI公司推出第一代DSP芯片TMS32010,之后又相继推出TMS320一系列产品TI公司的TMS320系列DSP产品已经成为当今世界上最有影响力的DSP芯片,TI公司已经成为世界上最大的DSP芯片供应商。,DSP芯片的发展(2),1984年AT&T公司推出的DSP32第一片高性能的浮点DSP芯片。Motorola公司推出DSP相对较晚
17、,1986年推出定点MC56001,1990年推出浮点MC96002;ADI公司在DSP市场上也占有一定的份额,1990年推出ADSP2101,之后又相继推出ADSP21000系列。,国产DSP与IP登场,2003年初首个DSP“中国芯”“汉芯一号”诞生之后,已取得了150万片的国际订单2004年初“汉芯二号”24位DSP;以IP专利授权方式进入国际市场的高端处理器芯片“汉芯三号”32位DSP芯片,申请了项专利,具有高速度、低功耗的特点标志着我国DSP技术研究取得重大突破。“汉芯”系列是由上海交通大学微电子学院研制成功的。,可编程DSP处理器以每年30%的速度增长,市场对DSP工程师的需求急剧
18、增大,信息技术的发展趋势,TI把上世纪90年代后期和本世纪初称为继(基于晶体管的)主机时代、(基于 TTL 和逻辑电路的)微机时代和(基于微处理器的)PC时代之后的基于模拟技术与DSP技术的“互联网时代”。,DSP特点、发展趋势,DSP器件的发展,兼顾3P的因素,即性能 (performance) 、功耗 (power consumption) 和价格 (price)。SOC(System On Chip)已是设计的大势所趋。DSP+ARM的双核结构,用户只需添加极少的外部芯片,即可构成一个完整的应用系统。更多并行的体系结构超长指令字(VLIW)方式或单指令/多数据(SIMD)方案。在极高端,
19、一些公司已开始使用多指令/多数据(MIMD)架构,实现最高程度的并行计算,从而使功能最大化。 期待 FPGA来扮演象DSP加法器或协处理器一样的角色。实现高并行的操作及可配置性。,DSP的发展趋势,Million Instructions Per Second,MIPS,各DSP公司比较有代表性的产品简介,TI公司为TMS320系列 :C3X,C67X为浮点处理器. AD公司产品ADSP21XX为定点处理器,如:ADSP2101/2103/2105,ADSP2111/2115,ADSP2161/2162/2163/2164/2165/2166,ADSP2171/2173/2181等。ADSP2
20、1XXX为浮点处理器,如:ADSP21020,ADSP21060,ADSP21062. AT&T公司产品AT&T公司比较有代表性的定点处理器有DSP16、DSP16A、DSP16C、DSP1610、DSP1616等。AT&T公司比较有代表性的浮点处理器有DSP32、DSP32C、DSP3210等 MOTOROLA公司代表性的定点处理器有MC56000、MC56001、MC56002。代表性的浮点处理器有MC96002等。 NEC公司产品NEC公司比较有代表性的定点处理器有uPD77C25、uPD77220等。NEC公司比较有代表性的浮点处理器有uPD77240等。,TI、朗讯/Agere、摩托
21、罗拉公司、Analog Devices,DSP的发展总结为:多、快、好、省,DSP 市场大致份额,DSP芯片制造商,ADI公司: TI公司: 朗讯公司: Motorola公司: DSP Group公司: Zilog公司: ,关于德州仪器公司(TI),德州仪器公司(TI)提供创新的DSP和模拟技术,公司的业务还包括传感器和控制产品,以及教育产品。在全球超过25个国家设有制造、研发或销售机构。德州仪器推出业界速度最快的18位模数转换器;90毫微米的集成电路工艺技术投产;9层金属结构;高性能电源管理芯片据 Engibous介绍,从美国到中国,目前有1,000家第三方软件开发商和900所大学专门研究开
22、发和讲授DSP架构. 中国大学计划(在47所大学设立约100个DSPS实验室)全球DSP竞赛(10万美金)。TI预想未来世界的方方面面都渗透着 TI 产品的点点滴滴,您的每个电话、每次上网、拍的每张照片、听的每首歌都来自 TI 数字信号处理器 (DSP) 及模拟技术的神奇力量。,TI的市场地位,1,DSP产品全球第一2,模拟产品全球第一3,无线产品全球第一4,图形计算器全球第一5,硬盘产品全球第一,“The Single Device Having the Most Significant Impact on Expanding the Use of Electric Motor Techno
23、logy is the DSP.” George Gulalo, President, Motion Tech Trends,多方联合,共同发展,教学中采用的DSP型号,选TIDSP(几乎100学校,个别学校有Motorola实验室)选型:C2000、C5000和C6000系列都有,开发环境完全相同,使用CCS软件学会一个DSP的开发,其它都比较容易上手课程介绍C2000系列 F240 F2407 F2812,第二部分:TI DSP概述,图 TMS320 系列产品命名方法,TI公司的DSP命名,C2000 DSP,以达到0.05mW/MIPs的最低 功耗性能比而具有最长的电池 寿命。 最佳的代
24、码密度 兼容C54x DSP软件,工作频率将达到1.1GHz 最好的DSP编译器, 便于 使用 兼容C62x DSP软件,可扩展性能达到400MIPs 最佳的C/C+ 控制代码效率 兼容C24x DSP软件,C5000 DSP,C6000 DSP,MotorControl DSP,Personal DSP,BroadbandInfrastruc-ture DSP,TI公司主推的三大DSP系列,Optical NetworkingControl of laser diode,TV screenDeflection of electron beam for small angle and shar
25、p corner TV screen,Automotive - EPSBattery operated precision for steering,PrinterPrint head controlPaper path motor control,Digital Power SupplyProvides control, sensing,PFC, and other functions,“Segway” Many new coolApplication to come,Tire PressureLow cost pressure sensing based on tire rotation
26、speed measurement,C2000系列DSP,应用领域,下一步可能的应用 .,互联网相关:智能电冰箱等,高速, 高密度磁盘驱动 数字视频 Internet 服务器,高效的电动汽车,高精度的加工工艺,C2000系列DSP,子系列,C2xx子系列:16位定点DSP、20MIPS代表器件:TMS320F206PZC24x子系列:16位定点DSP、20MIPS代表器件:TMS320F240LF240xA子系列:16位定点DSP、40MIPS代表器件:TMS320LF2407AF28x子系列:32位定点DSP、150MIPS代表器件:TMS320F2812、TMS320F2810,Up To
27、 40 MIPS,Control Performance,High-Precision Control,Multi-Function, Appliance & Consumer Control,150 MIPS!,Software Compatible,High-endDerivatives,Applicationspecificversions,ScaledDownversions,C2000系列DSP,Roadmap,TMS320LF2407 : 高集成度的DSP控制器,C2000: 参数选择列表,*C28x Broad Sampling Mid 2001*,Event ManagersU
28、ltra-Fast 12-bit ADC16.7 MSPS Conversion SpeedDual s/h enable simultaneous samplingAuto Sequencer, up to 16 conversions w/o CPU,Multiple standard communication ports provide simple interfaces to other components,Fast program execution out of bothRAM and Flash memory110-120 MIPS with Flash Accelerati
29、on Technology150 MIPS out of RAM for time-critical code,Control Peripherals,Communications Ports,F2810/F2812: 业界最强大的控制专用DSP,Control Ports,Target Application,Optical Networking, Power Supplies, Industrial Applications, Automotive, and many more,TMX today, TMS Production mid 2003,(Multichannel Buffere
30、d Serial Port)多通道缓冲串行口,最高的代码效率,伺服控制C编译器的编译结果比较,C28x,ARMThumb,SH-DSP,SH3,C28x: 最高的代码效率,C16x,C196,C5000系列DSP的应用,5000,C5000系列DSP,子系列,C54x子系列:16位定点DSP、100160MIPS,应用于低端产品代表器件:TMS320VC5402、VC5409、VC5410、VC5416C55x子系列:16位定点DSP、400MIPS,应用于高端产品代表器件:TMS320VC5510、VC5509、VC5502C54xARM7子系列:主要应用于嵌入式系统中,如静态数码相机代表器
31、件:TMS320VC5470、VC5471、DSC21C55xARM9子系列:主要应用于2G和3G手机中 即OMAP平台:Open Multimedia Applications Platform开放式多媒体应用平台代表器件:OMAP5910,C5000系列DSP,Roadmap,C5502400 MIPS,C5509288-400 MIPS,C5510320-400 MIPS,C55xTM DSP,DSP + RISC,Power Efficiency/System Density,Feature Integration,C5470C54xTM+ARM7,C5471C54xTM+ARM7,O
32、MAPTM OMAP5910,C5420 200 MIPS,C5421 200 MIPS,C5441532 MIPS,C54xTMMulticore,C5407120 MIPS,C5404120 MIPS,OMAP的基本结构开放式多媒体应用平台(OMAP)是TI专门位支持2.5G和3G手机应用需求而设计的处理器体系结构(DSPMCUMTC内存和流量控制器)。,C6000系列DSP的应用,6000,C6000系列DSP,子系列,C62x子系列:32位定点DSP、12002400MIPS代表器件:TMS320C6211C67x子系列:32位浮点DSP、12001800MIPS,9001350MFL
33、OPS代表器件:TMS320C6711、C6712、C6713C64x子系列:32位定点DSP,40005760MIPS代表器件:TMS320C6414、C6415、C6416,C6000 Catalog Roadmap,TI推出720 MHz 时钟DM642媒体处理器,TI 720 MHz DM642 processor Real-time HD decoding & transcoding: WM9, MPEG4, MPEG2 formats available Integrated peripherals:10/100 Ethernet MAC, 66 MHz PCI, 3 HD-ena
34、bled video ports Production qualified samples available nowC64X DSP Core,HD enabledSet Top-Box,HD ContentOut,Set-Top Box offers multi-format audio, video, and image encoding/decoding,AudioOut,SDRAM,Flash,AudioDAC,Video Encoder,HDD,PowerMgmt,DM642,Ethernet PHY,GPP,手机80的DSP用的是TI的DSP Core非DSP成品,仅IP Cor
35、e,SOC ? System On Chip,DSP总体结构,总结,DSP定义: DSPorDSP与MCU对比DSP的发展是:多、快、好、省DSP选型:了解各公司各DSP特点DSP系统的基本模型(与以前MCU系统类似) :,C2000 DSP片内具有ADC,使用PWM可以实现DAC,课程使用的ftp服务器,202.117.27.64 资料/ 电子课件/ DSP课程资料个别比较完整的优秀设计,费用实验室提供。作为实验展品,谢谢各位,TI DSP 性能总结,1.片内存储器的情况 C2000系列的片内RAM最小 (一般小于2k字) C5000系列较多 (几十k字) C6000系列最多 (几百k字节)
36、2.外部存储器的扩展能力 C2000的数据和程序寻址能力都只有64k字,但C28X进行了改进,有4M字的程序空间以及4G字的数据空间。 C3X、C55xx和C6000的外部存储器的扩展能力较强,一般可以到几百M字节,甚至到几个G字节。,TI DSP 性能总结,3.提供外设的能力 TMS320系列都提供同步串口、定时器、多种串口; C2000提供PWM、CAN等;C2000系列提供多通道的片上A/D转换器; C6000和C5000都有HPI、DMA接口; 个别C55xx型号,如5509带有USB接口。 个别C6000型号,如6205、6411带有PCI接口;4.芯片的运算能力 C3X,C67X
37、浮点;其它 定点 C2000:40MIPS150MIPS; C5000:80MIPS400MIPS; C6000:800MIPS1600MIPS。,TI DSP 性能总结,5.多CPU的混合系统 TI的C547X系列中在一个芯片上集成两个CPU,一个是ARM7,另一个是C54X;开放式多媒体应用平台(OMAP)是TI专门位支持2.5G和3G手机应用需求而设计的处理器体系结构(DSPMCUMTC内存和流量控制器), OMAP上的两个核是C55X和ARM9;有时采用多个低档的DSP并行比采用一片高档的DSP会大大降低系统的成本。,实时的概念,实时的定义因具体应用而异。一般而言,对于逐样本 (sam
38、ple-by-sample) 处理的系统 如果 sample process 我们就称这个系统满足实时性的要求。比如,滤波器,采样频率1kHz, 运算在1ms内完成宏观上的及时,比如奥运的转播,DSP芯片的选择,1. DSP 芯片的运算速度(各厂商)指令周期: 即执行一条指令所需的时间,通常以ns(纳秒)为单位。 MAC时间: 即一次乘法加上一次加法的时间。FFT执行时间: 即运行一个N点FFT程序所需的时间。MIPS: 即每秒执行百万条指令。MOPS: 即每秒执行百万次操作。MFLOPS: 即每秒执行百万次浮点操作。BOPS: 即每秒执行十亿次操作,TI的DSP在精密控制中的优势,MIPS,0,60,80,20,40,140,160,100,120,40MIPS,4X,12X,What is Digital Media Processor?,基于DSP核的SOC,