1、达芬奇五年沉浮嵌入式处理器架构之争决战 2012在 DM642 时代,是“一招鲜,吃遍天”。只有一颗处理器,无论客户做多少个产品线,多少种产品,只用维护一种开发环境和软件,只用保持为数不多的一个 BOM 清单即可;可是到了达芬奇时代,DM644x 算法买不起,自己做吧,还没做完,DM357 出来了。跟进 TI 的烈士们,累的跳楼的心都有了序:芯片是产业链上游重要的一个环节,一颗小小的芯片具有极高的技术含量和价值,半导体行业每年都会有一个各大厂商营业额的排名,除去 2009 年,常年盘踞在前三名位置的分别是英特尔,三星半导体和德州仪器(TI),英特尔凭借的是桌面处理器,三星半导体凭借的是其全面的
2、存储器产品线,TI 则是凭借模拟器件,嵌入式处理器和无线半导体这“三驾马车”。(注:DLP 应隶属于光电器件,所以未计入)终端是产业链中上游重要的一个环节,终端厂商用芯片设计出嵌入式硬件,并且基于该硬件开发相应的嵌入式软件,从而构成一个完整的嵌入式终端产品,形象的说就是一块电路板套一个外壳,这里面最重要的一个核心价值的产生就是附加在嵌入式可编程器件上的软件,成为嵌入式软件。系统是产业链中下游重要的一个环节,系统厂商通过平台软件使得多个嵌入式终端通过互联网进行信息的传递,从而为最终用户提供产品和服务。如在安防市场,视频服务器(DVS),硬盘录像机(DVR) 网络摄像机(IPNC)就是三种典型的嵌
3、入式终端产品,平台软件则可以通过互联网和局域网管理多个嵌入式终端产品,形成一套基于视频单工传输基本功能的监控系统;如在通信市场,专用视频会议终端配合系统集成商提供的平台软件和 MCU 可以形成一套基于视频全双工的多点视频会议系统;如在手机市场,iPhone 就是一种嵌入式终端产品,而苹果在线商店就是一个平台软件;如在广电市场,机顶盒就是嵌入式终端产品,结合运营商提供的云服务平台软件就可以玩 3D 游戏。结合嵌入式市场产业链关键构成因素之后,其产业系统模型可以抽象为:嵌入式产业系统 = 芯片 + 嵌入式终端 + 平台软件2005 年,TI 在 C6455 的 1.2GHz 高性能 DSP 处理器
4、之后,嵌入式处理器部门(DSP-Systems)的整体策略开始转变,即由以 DSP 架构处理器为主导的垂直行业市场战略向以 ARM 架构处理器为主导的通用行业市场进行战略转型,率先推出了代号为 DaVinci 的 TMS320DM6446 处理器。该处理器采用了 ARM+DSP+CP(注:CP 即 Co-Processor 协处理器) 的 SoC 架构,其中 ARM 采用了 297MHz 的 ARM926EJ-S 内核,DSP 采用了 594MHz 的 C64x+内核,CP 是一个可以支持视频和图像编解码以及其它常用处理算法的 VICP(Video-Image-Co-Processor)加速器
5、。很多观点认为 DaVinci 其实在技术上并无创新,因为 TI 的无线半导体部门的OMAP 处理器以及行业市场的 DM270 处理器早已经有了类似的架构,但笔者认为,达芬奇处理器最具革命性意义的就是它的全平台开放性,不同于用硬件直接做多媒体加速的应用处理器,达芬奇处理器提供的 ARM,DSP 和 VICP 是三个全部开放且可编程的内核。达芬奇技术的核心其实并不在于硅片本身,而是基于 Linux 的那套软件框架,它把一个基于多媒体应用的嵌入式软件抽象为应用软件和算法软件,采用 CodecEngine 框架组件规范了算法软件的开发标准(xDAIS)和统一接口(xDM) ,应用软件通过 Codec
6、Engine 来调用算法软件,在这个层面上,应用软件只运行于 Linux 之上,并不关心 Linux 运行于何种处理器内核上,算法软件被 CodecEngine 统一管理,所以应用软件也无需关心算法软件运行于何种处理器内核上。用 CMEM 组件来管理 DSP 和 ARM 之间的共享内存,用 DSPLink把 DSP 和 ARM 之间的通信模拟成一个类似于 Linux 多进程之间的 RPC(Remote- Procedure-Call),这其实是一件非常好的事情,可以使得 DSP 算法工程师和ARM 应用工程师并行工作而又确保了最后软件集成的统一规范。虽然这一次,TI 有专门的商用 Linux
7、开发商 MontaVista 为 DM6446 定制开发的内核,有全球多家第三方合作伙伴如 Ateme,Ittiam,Ingenient 开发的高性能Codec,有中国本土著名 IDH 时代飞腾提供的 RMVB 播放器解决方案,但是在2006 年,DM6446 在通用市场的推广之路却并非一帆风顺,因为 DM642 的客户已经习惯了在 Windows 操作系统下一个名曰 CCS 的集成开发环境里,写代码、编译、仿真、下载到目标板跑程序,可是突然让他们面对陌生的 Linux 系统,通过敲写命令行去编译代码,使用 vi 写代码,安装一堆 Linux 下的 LSP,文件系统,交叉编译环境和 DVSDK
8、 后还得配置一堆环境变量和路径,才能勉强运行一个例程?OMG!几乎所有的 DM642 使用者都发出了不可思议的惊叹,原来世界还有如此“落后”的开发方式和文本编辑器。试想一下,如果那个时候 TI 能够基于 Eclipse 推出一个类似于 GreenHill 的 IDE那样的 SoC 集成开发环境,使得 DM642 的用户可以无缝过度到 DM6446,那应该是怎样一种幸福?难过的事情并不止于此,层出不穷的内核 Bug 和匮乏的独立开发 DSP 端算法的资源可是苦了做产品的企业,光是一个 Audio OSS 全双工的 Bug 就愣是 N 个月没有给出完全搞定的 Patch,那个时候可真是一个内核升级
9、的 Patch 都十分抢手,更别说拥有 Linux 下的 cgtools 和 dspbios 安装包可以笑傲江湖,如果谁再有了 DVSDK,那简直可以仙福永享,寿与天齐了。那个时代,是一个 DSP 和 VICP 依然属于行业寡头的时代。所谓兵马未动,粮草先行。如果把芯片比喻成兵马,那开发工具就是粮草,TI应该同步推出基于 Eclipse 的双核集成开发环境替代 CCS,笔者猜想 TI 刚开始是想拉动一票业内公司构建一个完整的达芬奇处理器生态环境,像IDE,Codec , OS 都找第三方合作伙伴定制,但是要知道,拉人家入伙不是错,入了伙客户不买单那就是天大的麻烦,结果别说 IDE 和 OS 卖
10、出去的寥寥无几,就连 Codec 也是评估的多,买单的少,全中国达芬奇的粉丝们都在日夜赶工的定制有中国特色的 Codec.在 TI 推出了 DM6446 这颗旗舰产品之后,又陆续推出了DM6441,DM6443,DM6446 低频版本和工业级版本等处理器。这里面不得不说的一个公司就是时代飞腾,这是笔者很欣赏的一个公司,在 DM6441 的杀手级应用里,时代沸腾的 MP5 方案可谓是曾经风光一时,在没有硬件 RMVB 解码器的时代,DSP 再一次展现了可编程的魔力,遥想当年,华旗推出的基于DM6441 的高端 MP5 产品也是名噪一时,后来,时代飞腾又基于 DM6441 推出了网络电视一体机的方
11、案,但是 DM6441 的价格居高不下使得这个曾经是 TI 阵营王牌 IDH 的公司彻底转向 Telechips 的平台,笔者在时代飞腾的一个朋友抱怨到,TI 一颗芯片都赶上别人的一个 BOM 了。那个时候我就在想,究竟怎样的附加值和商业模式才能击碎消费市场产业链的利润“微笑曲线”,还是终究在消费市场做 IDH 就是一个利润夹缝中苟延残喘但又创造着将冰冷的芯片变成有生命力产品奇迹的商业行为?在第一轮达芬奇热还未褪却之时,TI 又推出了由十余种处理器构成的 DM643x家族,这完全可以看作是 DM644x 家族去掉 ARM 内核和 VICP 加速器之后的产品,伴随着 DM643x 处理器出现的还
12、有一个在技术上非常拉风的东西,那就是跑在 DSP 内核上的 Linux 虚拟机,这是一家叫做 Virtuallogix 的公司做的软件产品,它可以使得 DSP 支持 Linux,这再一次证明了 TI 想在 Linux 下统一管理和开发它的全部嵌入式处理器的软件框架战略,在前面提到过 DVSDK 里的一个组件叫做 CodecEngine,它可以使得应用软件通过 RPC 调用算法软件完成多媒体算法的调用,而不必关系多媒体算法在物理上究竟是运行于 ARM 还是 DSP,在DM6446 时代,或许觉得这无非是故弄玄虚,画蛇添翅膀,但当 DM643x 上跑着 Linux 的时候,一切都明朗了,基于 Co
13、decEngine 开发的应用程序可以无缝的在 DM643x 和 DM644x 的 Linux 上平滑过渡,这或许就是软件框架的优势吧。在被 DM644x 虐了 1 年后,水深火热的工程师们仿佛终于看到了曙光,终于看到了一颗貌似可以继承 DM642 衣钵的达芬奇处理器了,终于可以在 CCS 下继续裸奔着 DM642 时代的程序了,终于可以在一个彩色的视窗集成开发环境里抛开万恶的 xDAIS 算法标准写有中国特色的 Codec 了。于是,DM643x 因为有着比DM642 更先进的 DSP 内核架构和达芬奇响亮的名头走进了千家万户,在终于找到了 CSL 并且抛弃了虚拟机之后,工程师们又开始抱怨,
14、为什么 DM6437 只有一个 VPFE 而并非像 DM642 有多个 VPort 呢,这对处理多路视频将是多么的复杂,于是 DM643x 被打入冷宫,直到 DM3xx 应用处理器的 IPNC 大行其道,才被重新定为视频分析协处理器,视频分析软件供应商 ObjectVideo 将 DM643x 做成独立的视频分析模块,但阻碍这颗达芬奇处理器涅磐的依然是 ObjectVideo 昂贵的软件入门费和版税。不知是机缘的巧合还是天意,在 DM643x 家族问世后不久,DM648 横空出世,这是一个至今已经可以跑到 1.1GHz 的 DSP 处理器,它集成了 2 个千兆以太网接口和 5 个 VPort
15、视频口,DM648 才是真正的将 DM642 精神发扬光大的产品。在万众瞩目下,一个奇怪的事情又发生了,DM648 的开发板居然不是 TI 御用的Spectrum 公司设计的,相关的设计资料也是乏善可陈,至今仍然想不通为什么DM648 为何落得如此下场,国内第三方做 DM648 开发板的跟 DM6446 简直不在一个数量级。从性能上看,DM648 非常适合做多路 CIF 格式的视频产品,该处理器的 5 个 VPORT 口都是 16 比特数据位宽,和 DM642 一样可以同时吃进 2路 BT656 格式的视频,内部采用了 DSP+CP 的架构,其中 CP 和 DM644x 的 VICP是一样的,
16、可以支持 8 路 CIF 格式的 H.264 视频编码。2008 年,注定是不平凡的一年。TI 或许已经意识到了在中国这样一个神奇的土地上,有这样一个潜规则,那就是只有硬件是可以卖钱的,硬件上跑的所有东西你都要送我。于是 TI 开始做出这样一个决定,Linux 内核维护从以 MonvtaVista 为主树转移到以自己维护的内核为主树,逐渐往 Community Linux 靠拢,彻底摆脱 MontaVista;于是 TI 开始做出这样一个决定,自己做 Codec,因为客户听到第三方 Codec 昂贵的入门费统统都吓跑,自己去做有中国特色的 Codec 去了,TI 可郁闷了,这得做到猴年马月才能
17、量产,于是 N 多项目胎死腹中。当 TI 开始逐步透露要做 Codec 并且有可能免费的消息后,在业内也算引起了不小的震动,虽然 TI 一再在每年一度的全球第三方峰会上说他们只是做一些基本功能的 Codec 以应对其它半导体厂商应用处理器的免费 Codec 带来的竞争压力,但是,Ateme 还是转向 FPGA 平台,Ittiam 传言准备自己做 ASIC,Ingenient 则被 Sasken 收购,而此时的时代飞腾,则彻底放弃了 TI 的平台,转向更加经济实惠的 Telechips 和 Marvell,于是,TI 的 Codec 阵营就在这一年土崩瓦解。但是事情远比想象的严重,这位行业巨鳄开
18、始全面拉低嵌入式处理器产品配套工具的利润,达芬奇处理器的性能虽然是一路飙升,但是相应开发板的价格确实越来越低,最后 TI 终于祭出大招,OMAP3530 的 BeagleBoard 以一种社区开源模式面世,所有的硬件设计源文件以及驱动和操作系统都可以从网络社区下载,用于仅需要 99 美金就可以买到的 BeagleBoard 开发板,而同年份,合众达的 560 仿真器跳水到 4800 一只,BlackHawk 又推出仅 199 美金的 560Plus 仿真器,国内几家传统 ARM 开发工具供应商的 OMAP3530 开发板价格全部在千元以下,DM642 时代高利润的蓝海时代顿时变红,而且还飘着不
19、少第三方的尸体。令人感到不解的是,进入嵌入式市场的 OMAP3530 处理器依然保持着移动市场特有的 0.5mm 点距和 PoP 封装,过了好一阵子 TI 才发布 0.65mm 点距的硅片。OMAP 是 TI 在移动市场处理器的旗舰产品线,在 2008 年底推出的 OMAP3530集成了 Cortex-A8 内核,C64x+ 的 DSP 内核和硬件加速器,并且还具有 PowerVR的图形加速器。虽然血统不同,但 OMAP3 也可以粗略看作是 DaVinci 架构的低功耗版本,但跟 DaVinci 不同的是, OMAP3530 加强了 GPP 的性能,削弱了 DSP的性能,一个考虑是进一步降低功
20、耗,另一个则是市场因素,达芬奇处理器主要用于做视频压缩的产品,而 OMAP3 都是面向做视频解码和图形显示的产品,于是国内国外用 DM6441 做移动电视和便携式播放器的厂商为了保持竞争力又不得不转移到 OMAP3 平台上,因为该平台不仅有 3D 图形加速器,可以做 3D导航和玩游戏,还有比 DM6441 更低的功耗和更强的 GPP 资源。在 2009 年的TI 开发商大会上,Cortex-A8 内核确实是独领风骚,OMAP 阵营的参展商一举压倒了 DaVinci 参展商,诸多的 Android,WinCE 独立软件供应商和无线模组供应商开始加入 TI 的阵营,而 TI 发布以 ARM 为主导
21、的产品数量已经开始超过以DSP 为主导的产品数量了。像 TI 这样的公司,在以 DSP 架构为主的产品发展时期,结盟了众多第三方助阵,而当以 DSP 架构为主的产品走到成熟时期, TI 则毫不犹豫的踹掉了这些第三方公司(虽是无奈之举但毕竟是不争的事实) ,为的就是进一步降低通用市场客户的入门成本,举个例子就是:以前 10 万美金的 Codec 入门费对垂直行业的那些寡头算个毛,但对通用市场的客户来说,打死也不会掏钱的。所以,在商场上,只有永恒的利益,没有永恒的友谊,TI 这么做是战略转型的必然结果。为了在高清网络摄像机(HD-IPNC) 市场拔得头筹,TI 在 2008 年初率先推出了可以做到
22、 720P30 实时 MPEG4 编码的 DM355 处理器,和 OMAP3 一样,DM355处理器带有浓重的行业寡头特色,它原本是一颗做数码相机的处理器,所以拥有 2 个 SD 卡接口却没有 EMAC,大概是柯达的数码相机并没有连网的需求吧,于是 Spectrum 通过 DM355 的 EMIF 总线接口扩展了百兆以太网接口,但这还远远不够,DM355 平台为了降低成本,抛弃了 DM644x 和 DM643x 家族采用 Nor flash 作为启动存储器的方案,改用 SLC NAND 闪存存放启动代码和文件系统。为了进一步降低成本和推进市场增长,TI 选择了 Appro 公司为其定制高清网络
23、摄像机参考设计,在这一点上,TI 的思路是非常正确的,因为在高清分辨率下,CCD 传感器非常昂贵,而 CMOS 传感器像原尺寸又做不大,导致本身在低照度下就就性能欠佳的 CMOS 传感器的成像质量在高分辨率时是差上加差,于是 TI在 DM355 处理器内部集成了一个叫做 ISP 的硬件影像处理单元,可以直接支持RAW 格式数据的处理,我们姑且管这一块叫做影像预处理,有了 ISP,DM355处理器就可以无缝的对接各种图像传感器了。再来看看图像传感器供应商,Aptina 的传感器一般叫做 Sensor,可以直接输出 RAW 格式的数据,Ovt 的传感器一般叫做 SoC,内置了 ISP,低分辨率的产
24、品可以直接输出 YUV 的数据,高分辨率的产品也是输出 RAW 格式数据。不知是因为 TI 和 Aptina 高层的关系很好,还是为了彰显 DM355 处理器 ISP 的英明神武,在 Appro 的这个参考设计里选择了 Aptina 公司的 MT9P031 5MP 传感器,专门使用 DM355 的 ISP 开发了针对MT9P031 CMOS 图像传感器的影像预处理算法,于是变形金刚合体,在 2008 年初,万众瞩目的 720P 高清网络摄像机参考设计闪耀登场。TI 认为自己的这番努力已经秒杀了掌握最先进 ISP 技术的日系厂商,成功的把DSC 的成像技术移植到了 IPNC,势必会引爆一个巨大的
25、市场,高清视频,极低的成本,成熟的 ISP 技术,甚至连镜头和外壳连带完整的硬件参考设计都已经准备就绪,整个 BOM 成本不到 40 美金,而整个参考设计除了提供全套硬件源文件外还有全套的 Linux 参考软件,整套方案售价仅为 995 美金,这个就是Appro 在 2008 年 TI 开发商大会推出的 DM355 高清网络摄像机参考设计,但是请注意,这仅仅是一个参考设计,而不是一个深圳模式下的解决方案。在深圳,只有 MTK 那样的才叫解决方案,英文叫 Turn Key,套用大腕儿里的一句话,什么叫方案知道么?只要注入一笔钱,再找个工厂一量产,产品和利润就出来了,我们做方案的口号就是,不求最好
26、,但求最快!是的,当时笔者还真是听说深圳有人直接拿 Appro 的这个参考设计去工厂生产,结果自然是无法量产,投资失败,因为 Appro 此次的“方案”并非 MTK 的 “方案”之含义,准确的说仍然只是一个参考设计框架,而不是一个立刻可以被量产的产品。为了推广 DM355 处理器,笔者也曾多次前往深圳,记忆颇深的是拜访一家做网络摄像机的客户,研发总监亲自接待,说:“你们(其实笔者非TI 的人 )的这个 DM355 压缩效果不行,我接高清电视看了,都是马赛克。”笔者顿觉惊诧莫名,问道:“您是用复合视频接到高清电视上看的?”该总监道:“正是。”笔者顿觉无语,须知复合视频怎可传递高清视频信号?好吧,
27、遂指出该总监 “疑惑”,为 DM355 正名,继而该总监又说到:“我们现在用其它方案 D-In,网络摄像机量很大,我们只要每台挣 1 个美金就可以开始跑量!”这就是一个非常典型的深圳市客户,他们崇拜的是 MTK 式的神话,他们需要的是一个可以马上量产的方案,他们需要的是一个可以带动生产力和现金流的Turn-Key- Solution,他们的特点就是简单快速,薄利多销。从技术角度看,DM355 的功耗和性价比还是非常不错的,采用了 0.65mm 的点距,内建了 ISP 装置得以处理 Aptina 的 5MP 像素传感器的 RAW 格式数据,该传感器使用了 2x2 的 binning 模式来增强成
28、像质量,可以输出 720P30 的 MPEG-4视频流。但遭人诟病的是,DM355 内部的 ISP 行缓存不够长,在做 5MP 抓拍的时候,需要 2-Pass 才能完成处理,2-Pass 就是先把图像采集到内存,上半边通过 ISP 处理一下,下半边再通过 ISP 处理一下,也正巧了,赶上那年交通行业的相机都要 5MP 抓拍,惹得全国上下用 DM355 做相机的厂商怨声载道,那能搞出 5MP 抓拍的都是神仙?妖怪?如果 DM355 定位于启动低成本高清 IPNC 市场的引信, TI 是绝对应该找一家平台软件供应商推系统方案的,Appro 的参考设计和深圳模式是不搭调的,也错过了山寨高清网络摄像机
29、的第一桶金,后来的 DM365 和 DM368 时代,Ambrella 和 MG3500 已经可以在这个市场分到一杯羹,TI 人无我有的战略优势丧失殆尽,顿时变成了人有我优.2009 年春暖花开之时,TI 果然毫不迟疑的推出了能支持 H.264 720P30 压缩的DM365 达芬奇处理器,该处理器可以认为是 DM355 的完善版本,除了更新了ISP 之外,DM365 使用了和 DM355 相同的 ARM926E-JS 内核,使用了 DM355的 MJCP 硬件加速器,这个加速器可以做 MPEG4 的编解码和 JPEG 的编解码,同时加入和 DM6467 的 HDVICP0 这个可以支持 H.
30、264 硬件编解码的加速器,构成了 DM365 的基本架构,当然,植入一个 EMAC 弥补 DM355 的鸡肋还是不难的。这里面请注意,TI 在 HDVICP0 上一直没有 MPEG4 和 JPEG 的 Codec,虽然HDVICP0 号称可以支持 MPEG4,于是就只好来一个组合拳,可以说 DM365 是DM6467 和 DM355 联姻的结晶。但是光 720P 还不够,DM365 的弟弟 DM368在 2010 年也会出世,要问怎么做到 1080P 的,超频,超频!DM36x 既然出来,Appro 自然也不会闲着,在 2008 年以摧枯拉朽之势忽悠了众多客户之后,2009 年继续推兜售他们
31、的 ISP 算法,这次不光是 Aptina 的传感器,Sony 和 Ovt 的传感器也用上了。说到传感器,这里有一个有趣的现象,在Aptina 剥离 Micron 之后,TI 开始很低调的做一种基于 CMOS 技术的宽动态传感器产品线,那么自然可以大胆推测,凭借 TI 的野心和实力,既然想把网络摄像机做到白菜价,那么它就得把 CMOS 传感器和 DM368 做到一颗芯片里,真正的实现“俺们也就走个量,一个只挣 1 块钱”的宏伟蓝图。从技术角度看,DM355 处理器的 MJCP 是由 DM644x/DM648 的 VICP 演变而来,而 DM36x 的集成度要比 DM355 强一个档次,不仅集成
32、了 AudioCodec,还能在单通道视频接口 VPFE 上做多路视频流的 Demux, NAND 闪存控制器也从DM355 的 1-bit ECC 变成了 4-bit ECC,而且还支持硬件人脸检测功能,同时解决了 ISP 内部行缓冲不够的问题,终于可以支持 1-pass 的高分辨率图片抓拍。在参考设计资源上和 DM355 不同的是,DM365 除了 Appro 提供的 IPNC 参考设计,还有 UDWorks 公司的 DVR 参考设计,该参考设计可以支持 8-CIF 或者 2- D1 的视频压缩,使用了一颗 TI 同步推出了高性能四通道视频 ADC 芯片 TVP5158,大概是看到 Tec
33、hwell 在 DVR 市场赚了不少,TI 也开始做多通道的视频 ADC 产品,刚想说那 Techwell 的市场应该会让出一部分,就听闻 Techwell 以 3.7 亿卖给Intersil 了.DM6467T 作为 DM6467 家族的最高端产品,拥有近乎 1GHz 主频的 DSP 内核,500MHz 主频的 ARM926E-JS 内核以及 2 个 HDVICP 硬件协处理器,其中HDVICP0 可以支持 H.264/VC-1/MPEG-4 高清编码,HDVICP1 可以支持 H.264/VC-1/MPEG-4 /MPEG-2 高清解码,而该处理器显然和任何一款 DaVinci 家族的处理
34、器不同,它的 VPIF 决然不同于 VPFE 和 VPORT,该端口仅支持嵌入同步的视频格式,但是却可复用为 TS 流传输或接收模式,可以非常方便的支持 DVB-ASI 接口,这是一颗明显带有广电行业特色的处理器,它可以单芯片实现 MPEG2 到H.264 的实时转码功能,并且支持千兆以太网接口,而且一直号称可以支持1080P60 H.264 高清编码。TI 这种从 DSP 单核心架构到 DSP+ARM+硬件加速器 SoC 架构再到 ARM+硬件加速器 SoC 架构的转变过程非常之快,在不到 3 年时间内先后快速推出多种处理器,而且还都是先找寡头买单,再挪到通用行业市场。从某种意义上说,观望的
35、客户会引起“审美疲劳”,跟进的客户会发现“投资贬值”,也就是 TI 并没有很好的保护客户对它的投资。在 DM642 时代,是一招鲜,吃遍天,只有一颗处理器,无论客户做多少个产品线,多少种产品,只用维护一种开发环境和软件,只用保持为数不多的一个BOM 清单即可;可是到了达芬奇时代,DM644x 算法买不起,自己做吧,还没做完,DM357 出来了,那就用 DM6467 做 720P 产品,结果 DM365 出来了,只好用 DM6467 做 1080P 产品,结果 DM368 又呱呱坠地;如果刚用 DM6441 做完D1 H.264 网络摄像机,DM355 的 720P MPEG4 又得换一套 DV
36、SDK,还得琢磨0.65mm 的点距,从 644x 的 NorFlash 换成 SLC NAND;1 年后,没辙,继续跟进DM365,这时候估计已经比放弃 DM355,专盯着 DM365 的客户要慢了几个月了;君不见 DM365 官方开发板上辉煌的电源方案足可以引多少英雄豪杰竟折腰(用了十几种);相比于 Ambrella 的 IPNC 方案和海斯的 DVR 方案,TI 的参考设计又明显缺乏成熟的“山寨化”软件;纵观跟进 TI 的烈士般的公司们,累的跳楼的心都有了,光是那一套套不一样的 DVSDK,一堆堆形形色色的 Patch,就已然头昏脑胀了.TI 在 2009 成功收购了 Luminary,
37、补强了 MCU 的产品线,形成了以MSP430,Cortex-M3 和 Cortex-A8 为核心的高中低档全线 MCU 产品线,初步实现了硅片产品的战略布局。在软件方面,抛开 MontaVista 之后,Linux 全面转向Community 阵营,IDE 转向基于 Eclipse 的 CCS4.0,至此,算是基本完成了由DSP 为核心的处理器架构向以 ARM 为核心,DSP ,硬件加速器为辅的处理器架构。TI 的网站在 2010 年也做了结构性的调整,Processor 下面出现了ARM,DSP 和 MCU 三个板块。DSP 这种处理器架构还能保持多久的生命力是一个值得探讨的问题,嵌入式处
38、理器市场的竞争本质还是架构之争。有一个观点是任何一个处理器设计公司都不会同时维护两种架构的处理器产品,如 Intel 公司先是改造 ARM 架构,做出XScale 处理器,但是后来却卖给了 Marvell,为的就是统一桌面处理器和嵌入式处理器的架构,后来推出的 Atom 等一系列处理器都是基于 x86 架构的瘦身产品,且不说 Marvell 吃进 Xscale 后赚的盆满钵满, Xilinx 也将在 Spatan-6 和Virtex-6 之后统一自己 FPGA 架构。TI 又何尝不想如此,但是因为它的产品线过于庞大,也就注定需要很长的时间了。首先在 C64x 和 C64x+的 DSP 内核架构
39、之后,又推出了 C674x+内核架构,该架构统一了浮点 DSP 和定点 DSP 内核;其次在 DM8168 和 OMAP4 处理器上,TI 则会统一硬件协处理器的架构,即 OMAP4和 DM8168 都采用 IVA-HD 这种相同的硬件加速器;至此,TI 在 SoC 上已经形成了 C674x+Cortex+IVA-HD 的统一架构 SoC 雏形。记得 ADI 公司早在若干年前就关闭了以色列的 TigerSharc 设计中心,其理由是,该处理器已经登峰造极,没有再发展的必要;在桌面处理器市场,主频提升早已遭遇瓶颈,多核心时代正在到来,而 ARM 此时已经不声不响迈入双核 2GHz的 Cortex
40、-A9 时代。TI 的 DSP 也是如此,C6000 架构已经成熟多年,1.2GHz 似乎已经是不可逾越之极限,于是 2009 年 TI 发布了 3 个 1.2GHz 核心的高性能多核 DSP 处理器 TMS320C6474,这也是一颗从垂直行业市场拿到通用市场的处理器(TI 开始晒家底儿了?),随后又发布了拥有 6 个 700MHz 内核的TMS320C6472 多核 DSP 处理器,但恐怕由于功耗的原因,基于 65nm 工艺的C647x 系列很难再有突破。多核心 DSP 未来的道路确实很艰难,因为它已经处于一个非主流的位置,虽然不排除在更先进的工艺节点上植入更多的 DSP 内核甚至是 Co
41、rtex-A9 内核完成统一处理器架构和软件框架的疯狂构想。在 Intel 收购风河公司,Xilinx 和 ARM 结盟,Altera 和 MIPS 联姻,Winter 联盟被 ARM 和 Google 瓦解之后,嵌入式市场就要好戏连台了。在 Intel 没有想明白是不是像 ARM 那样进行 IP 授权来运营 Atom 的时候,请将目光移向 ARM 阵营,Altera 其实在很早以前就有过一款集成了 ARM7 硬核的FPGA 产品,笔者非常奇怪为何 Altera 要做这样一个看起来并不十分明智的产品,须知在那样一个年代,一个昂贵的,功耗很大的 FPGA 去联姻一个廉价的,功耗很低的 RISC
42、究竟意义何在?而 Xilinx 在 SoPC 的战略上无疑是成功的,它选择了同样昂贵,功耗很高但同时性能也很高的 PPC 硬核,从 Virtex-II 一直到Virtex-5 的产品中都可以看到集成 PPC 硬核的产品,但是这一切都将在 28nm 节点工艺改变,在 28nm 技术上,Xilinx 选择了高性能低功耗的工艺,而 Altera 则选择了更高性能但高功耗的工艺。因为在 28nm,Xilinx 将植入 Cortex-A9 硬核处理器,创造真正的低成本,低功耗的 SoPC 产品,继续向嵌入式市场挺进,试想如果一颗集成了 Cortex-A9 的 SoPC 芯片售价 15 美金,你还会选择相
43、同价位的SoC 吗?笔者认为 Xilinx 选择在 28nm 节点统一产品架构是因为此时 FPGA 的功耗和成本跟 PPC 已经不再匹配,ARM 才是最好的选择。如果 TI 的嵌入式处理器产品线架构是一个线性空间,那么它的正交基是:DSP内核,ARM 内核,硬件加速器和通用外设,用公式表述一个 TI 的 SoC 定义为:TI SoC = a * DSP + b * ARM + c * Accelerator + d * Peripheral而当 FPGA 在 28nm 拥有 Cortex-A9 的双核处理器和标准外设,客户已经可以在功耗和成本都可接受的 SoPC 上定制自己的硬件加速器和接口设备,用公式描述一个 Xilinx 的 SoPC 定义为:Xilinx SoPC = a * ARM + b * Customer-Accelerator + c * Customer-Peripheral一种新的嵌入式处理器架构的诞生或多或少都会引起变革,2005 年是 TI 的SoC,2012 应该属于 Xilinx 的 SoPC。