1、- 1 -多媒体系统和组件技术3G 网络上的视频应用实施总述在经过了 3 年的期盼之后,等待终于结束了:第 3 代移动通讯服务(3G)终于在英国开始展开了。在 2003 年的 3 月 3 日,和记电讯向全英国推出了名为“3”服务的市场推广攻势。在承诺提供一系列崭新的诸如视频呼叫、卫星定位和高速上网等的服务内容的同时,运营商已经为有史以来最具风险性的一项投资的大肆宣传,实质性地做了一项值得众人瞩目和敬佩的工作。本报告提供了有关在 3G 网络的视频性能背后技术和服务方面的深入论述,并以 3G 提供给移动终端设备的数据性能为中心概要介绍 3G 的架构,同时也简述在英国的 3G 实施现状。“多媒体消息
2、服务(MMS) ”标准的审定,主要着重对其视频媒体能力和所要求的视频编码算法等方面评估。这些算法,如随后介绍的 H.263 和 MEPG-4 将根据其在手持式终端上的移动无线环境中的使用进行比较。现时 3G 网络所提供视频服务,以 Sony Ericsson Z1010 此种 3G 终端作为应用实施对象来进行推介。这些服务包括视频呼叫,视频消息传送和通过消息及流方式的内容分发。在今后的应用中,将针对潜在的广泛的可利用的移动视频服务而展开。新产生的视频编码标准将与现有标准一同呈现在大众面前供作比较。目录一、介绍二、 3G 网络概述- 2 -1. 什么是 3G?2. 线路交换和数据包交换3. 3G
3、 在英国三、3GPP MMS 标准概述1. 介绍2. 所支持的媒体类型3. 所支持的多媒体数字信号编解码器4. 文件格式5. 寻址6. 发送四、3G 的视频标准1. 介绍2. H.261:用于视频会议的运动视频编码3. H.263:用于低速率通信的视频编码4. MPEG-4 Visual五、3G 上的视频应用1. 呼叫2. 消息传送3. 内容分发:消息传送方式4. 内容分发:流传送方式六、移动视频技术的未来1. 新兴标准:H.264/AVC2. 未来的应用2.1 约会服务2.2 居家监控2.3 购物- 3 -七、结论八、多媒体技术总结1. 流视频2. 显示3. “运动预估”的应用4. 图形加速
4、方面的发展趋势5. 光纤6. 虚拟现实一、 介绍当前,移动终端和网络技术的发展,给个人通讯提供一个新的方式。在现时可行的新服务和应用中,移动视频技术是最为吸引人的一种。它使得移动用户在分享他们的体验、情感以及他们访问信息和娱乐内容的方式发生了巨大的变化。第一波“实况”3G 网络所提供的视频服务可分为如下三类:呼叫,消息传送和内容分发。基于传统陆路通讯网络的视频呼叫未曾实现过,这部分归咎于成本方面的问题但主要还是由于视频质量偏低。3G 网络所提供的带宽终于为视频呼叫提供了一个适合的传送媒体,而且,由于近期在视频压缩标准方面的进步,所传送图象质量也显著提高。视频消息传送旨在建立在过往 5 年里文本
5、式(SMS)消息传送的爆炸性增长的基础上,使得用户能创造及分享媒体内容。就如同新近在 2.5G 网络上所实现的相片消息传送一样,视频消息传送是基于多媒体信息服务(MMS)标准的,它是一个由称为“第三代合作计划(3GPP ) ”的组织所开发的标准。尽管“视频消息传送”主要还是限于用户间的通讯, “视频内容分发”则将由服务供应商发送给用户。这种应用的可能范围几乎是无限的,如在英国,首个 3G 供应商“3”在初期提供的服务包括了 ITN 新闻公告板、英国超级足球联赛精选以及电影发行时的介绍短片等。同时,这些信息是以视频消息传送的形式,下载(通过所谓的“推”或者“拉”的方法)到终端并由用户在其方便的时
6、候进行回放的。在未来,服务供应商分发模式的发展趋- 4 -势将是在实况(例如突发性新闻)和离线内容(例如整部电影宣传短片)上实现流式传送的实时化。虽然在成本和电池寿命上,仍然制约着用户从现有的移动服务迁移到新的技术,但移动终端技术的发展,已经将高分辨率彩色屏幕和照相机结合于一体。为 3G 服务所作出的等待是漫长的,这部分要归咎于为了保证相互兼容性和互可操作性所做出的涉及面广泛的标准化工作。这些标准保证了在用户体验上的达到一个可以接受的水平,如果没有它们,那么移动通讯巨大的潜在能力将被拙劣的兼容性、不可靠的服务以及有限的漫游能力所阻碍。本报告将深入探讨部分标准,这些标准对发送视频服务到 3G终端
7、起到了一定的帮助。二、 3G 网络概述1. 什么是 3G?移动通讯的集聚以及因特网一直领导一项称为第三代移动服务的技术的发展,该技术旨在高速带宽无线链路上实现基于 IP(网际协议)的服务。在这技术之前,已经在 80 年代出现了最初的第一代模拟移动电话网以及在过去 10 年里爆炸性扩张的第二代数字 GSM网络。第三代(3G)服务不仅仅是提供移动设备的 Web 快速接入,而且在通讯、信息访问、商业运作、学习和娱乐方面都采用焕然一新的方式。快速的数据速率与扩展多媒体和娱乐内容一道将以一种革命性的方式,增强移动因特网的使用效能,而不象 2G 网络时WAP 技术所带给人那样的失望。3G 以 WCDMA
8、的形式推出宽带无线通讯服务,这种形式理论上的访问速度达到了每秒 2 兆比特(2Mbits/s ) 。相比较今天的移动网络, 3G 显著提高了网络的容量,这对于高度密集的区域来说是相当需要的。这样一来,运营商可以给更多的用户提供支持,同时提供更为丰富的服务。WCDMA 同时还实现了对声音、视频和电邮等几项数据服务的同步访问。除了基于数据包的核心网络和 WCDMA 无线接入网络之外, 3G 技术还包括了许多 2G系统的革新。一个典型的例子就是 MMS 服务,它使得丰富的多媒体信息交换成为可能。2. 线路交换和数据包交换在移动网络上有两种数据通讯的方法。线路交换法包含了数据呼叫的建立,它类似于- 5
9、 -建立一个语音呼叫,但数字数据而非语音的传递则除外。数据可以在呼叫正在进行中时在呼叫线路上进行传送。另外的一个方法就是数据包交换。当移动设备有一数据包需要传送时,它将此数据包在没有建立呼叫的情况下传送到网络上。由于无须建立呼叫,数据包交换方式有时被称为“总是在线” 。有关 2G(GSM)网络上数据包服务的补充,常被称为2.5G(GSM-GPRS ) 。如果网络是支持数据包交换并且提供了宽带接入的,那它就被称为3G。3G 标准所要求的最低数据传输速率 ,在线路交换方式上为 64Kbps,而在数据包交换方式上为 144Kbps 带宽。3. 3G 在英国2000 年春季所进行的 20 年期限 3G
10、 许可牌照的拍卖,为英国政府获得了多达 222 亿英镑的巨额收入,而第一个 3G 网络才刚刚在英国推出。在为获取许可而进行的巨额投资以及建立新网络所产生的巨额成本之下,移动运营商正为能从其投资中获取回报而面临前所未有的压力。网络的推出一次次地被推迟,而且直到现在仍然有四个获得许可的运营商仍然未有任何推出该网络的迹象。运营商们倾向于等待,但同时他们也在为 3G 电话开发出更多的应用程序,以此来帮助其获得最大的回报。缺少卖点的产品自然难以吸引用户从成熟的 2G 市场上迁徙到 3G 上,尤其是在手持设备和线路租用成本的增加更是致命的因素。3G 的成功,必须依靠适路可销的产品并结合优秀的用户体验。而且
11、,到现在也很难说是否“3”能兑现其所承诺的。三、3GPP MMS 标准概述1. 介绍3GPP 多媒体消息系统(MMS)标准的的主要目标是提供一个框架,以供进行丰富媒体的消息交换,这类似于在 GSM 网络上流行的基于文本的 SMS 服务。和 SMS 一样,MMS 不是实时的,但却已经突破了其前者(仅支持最多 160 个字符的文本)的限制,它准许用户深入使用从图象到音频、视频等范围广泛的各种类型媒体。MMS 标准可以在WAP 或者 IP 协议上实现消息的交换,同时也迎合了对未来各种新内容类型的支持需要。3GPP 并没有对 MMS 服务本身进行标准化,而是详细阐明了 MMS 服务推行上服务能力特性的
12、标准化集合。- 6 -本概述提供了有关 MMS 标准的简要介绍,主要针对视频内容交换方面的内容。基本的 MMS 网络架构如图 1。2. 所支持的媒体类型指定由 MMS 标准支持的媒体格式现行集合如表 1 所示。SMIL 和 XHTML 标准用于定义在 MMS 消息里各种各样的媒体组件的布局和行为。媒体 格式文本 纯文本,纯 Unicode 字符语音 AMR 和 AMR-WB声频 MPEG-4 AAC LC (LTP 可选)合成声频 SP-MIDI静态图象 JPEG 和 JFIF位图图象 GIF87a,GIF89a,PNG视频 (如下)矢量图形 SVG-Tiny表 1 MMS 所支持的媒体格式3
13、. 所支持的视频解码器- 7 -考虑现有的一一系列视频解码器,对于移动设备而言,要支持其中大部分的类型是不切实际的。为了克服这一问题并且减少移动设备为支持视频回放所需要的支持,MMS 标准声明只明确支持一种视频解码器,另外的 2 个作为候选支持。所列明的解码器如表 2 所示。视频解码器 需求性H.263 Profile 0 Level 10 要求H.263 Profile 3 Level 10 可选MPEG-4 Visual Simple Profile Level 0 可选表 2 MMS 所支持的视频解码器4. 文件格式MMS 标准所指定的文件格式是 3GGP 文件格式,它带有 3GP 的文
14、件扩展名,并且是在 ISO 基础上的媒体文件格式。一个 3GP 文件可以包含多种媒体类型但最多仅支持一条视频通道,一条音频通道和一条文本通道。该中文件必须完全独立封装并且不包含文件外部的媒体引用。这种文件格式可以用来发放采用 MMS 的媒体片段。为了对用户在媒体方面的要求更予更好的回应,该文件格式支持累进式的下载,这样一来终端就可以在文件被完全下载前开始回放。为了支持累进式的下载方式,文件的创作必须遵循某些指引。首先,文件的开头必须放置会话信息,这样一来终端才能判断媒体的类型。媒体通道必须插入到文件中,这样一来客户端才能轮流接收到每种媒体类型。5. 寻址MMS 标准要求以移动用户的电话号码(M
15、SISDN)或者电邮接收人(例如)为标识来发送消息。更而且,该标准详细指定单一消息必须可以为多个接收人设定地址。这种可圈可点的增强特性使得 SMS 系统的单一移动接收寻址相形见绌。6. 发送- 8 -MMS 标准订明了可供消息提交和传送的几个不同的选择。首先,用户可以从他们的移动终端上提交消息,这与现有的 SMS 服务是一样的。另外的一个方式就是网络能自动地将消息“推”给接受人(例如由于新闻订阅服务的需要)或者从一个用户所要求的终端上“拉”来消息(例如一个需要公司传送财务报表的请求) 。MMS 标准提供了信息传送上的存储和转发功能,而不仅仅是一种邮箱类型的模式(电邮类型) 。在其他各种服务当前
16、正处于活动状态时(例如浏览 Web) ,移动终端必须能同时接收MMS 的消息,并且必须能将消息发送进行流式化。这样一来,用户能在消息完全下载到电话之前打开并且查看它。四、3G 视频标准1. 介绍3G 网络上用于视频通讯的 3GPP 标准定义了使用于视频消息传送(参看 3.3 部分)和视频呼叫的视频解码器。在交换线路上实行 64kbps 速率的实时呼叫时,H.263 是推荐标准,如图 2 所示。可选的其他视频解码器中,MPEG-4 和 H.261 不是标准所要求的,但可作为可能的候选标准。2. 用于视频会议的 H.261 运动视频编码作为标准中的 H.320 组的视频解码器组件, ITU-T R
17、ecommendation H.261 标准支持视- 9 -频会议应用方面的视频编码。H.261 算法原先是作为在 ISDN 上的视频会议和视频电话所开发的,提供数倍于 64Kbps 的数据传输速率。在以前,它设计用于双路视频通讯但仅停留再两种固定图象的解析方式,即公有媒介格式(CIF)和四分之一 CIF 格式。视频信息以 Y,C r,&C b 组件表示,如表 3 所示。解析方式 亮度(Y) Cr Cb 最大帧速率/秒QCIF 176X144 88X72 88X72 29.97CIF 352X288 176X144 176X144 29.97表 3 H.261 所支持的分辨率许多的 H.261
18、 应用包含有在 64Kbps 或者 128Kbps ISDN 连接上的视频通讯。在采用这些传输速率的情况下,需要较大的压缩比率,通常选择 QCIF 作为解析方式,在这种情况下,源帧率限制在约每秒 10 帧左右。H.261 编码算法是以离散余弦变换(DCT)压缩方式和宏块子图象运动补偿帧间预测的方式的。当 H.261 此种解码方式工作于 128Kbps 的速率或之下时,一个明显的特征就是所解码视频讯号衰减,如果运动突然增加的话图象会被“分解” 。由于 3G 网络上可提供 64Kbps 的线路交换通道,很显然,H.261 标准以前是不适合的,这也促成了对 H.263 标准的开发。3. 用于低速率通
19、讯的 H.263 视频编码ITU-T H.263 编码算法是 H.261 的扩展。H.263 描述了一种算法,有如 H.261,该算法在宏块结构上采用了 DCT、运动补偿、可变长编码(VLC)和标量量子化等技术。该推荐标准在低速率的情况提供了更高质量的视频,这与 H.261 有如下几方面的不同:- 带半象素预估的动态补偿(这与 H.261 中的全象素正好相反) ,产生了有所改善的动态预估并减少了预测错误。- PB 帧模式(可选) 。两个帧被编码为一个单位:通过前后 P 帧的双向预测,使得下一个 P 帧(从前一个 P 帧中预测到转发)与 B 帧结合在一起。这种模式是基于使用在MPEG 标准中 B
20、 图象的。- 重合块运动补偿- 与先进的预测模式配合实现无限制的运动矢量作业,允许运动矢量在图象区域意外布- 10 -点。总的看来,对于同等图象尺寸和可觉察的图象质量来说,H.263 系统主要提供了比H.261 高 150%的性能上改进。对于有限屏幕尺寸的移动终端而言,H.263 推荐标准最为显著的意义就是准许 sub-QCIF(或者 4CIF 和 16CIF)附加输入解析方式。Sub-QCIF(SQCIF)图象格式提供了 128X96象素的亮度分辨率,这对于移动终端上的视频呼叫而言是相当足够的了。指定用于 3GPP 标准的特性和层次关系到 H.263 标准的一个附件,该附件定义了一部分优选的
21、特性组合。表 2 中所列出的必选和可选的 H.263 信号编码器,都共同采用同一层(10)但在特性方面则有所不同(0-要求;3- 可选) 。相关的描述可以在表 4 中查得。可选的第 3 个特性描述了一个采用 H.363 更多特性的、更为复杂的编码解码技术,该技术能对图象质量的改进和减少移动终端的速率起到一定作用,但这同时可能会消耗更多的电力并降低回放性能。H.263 特性/层次 总结第 10 层 - 支持 QCIF 和 SQCIF 解码方式- 数据流达到了 64Kbps- 帧速率最大可达 15fps特性 0 基线特性有关 H.263 推荐标准(不带可选特性)的基本操作特性 3 第 2 版本交互
22、及流式无线特性基线特性再加上如下特性:- 高级 INTRA 编码方式- 解锁式过滤器- 切片式结构- 改良的量子化方式4. MPEG-4 VisualMPEG-4 Visual 标准是全面的 MPEG-4 基于对象的媒体工具集的一个子集,主要针对一系列范围广泛应用的视频编码方式,包括移动通讯。容错性以及高效率的特点使得这种编码方式尤其适合于 3G 的应用。MPEG-4 Visual 以特性进行组织并在这其中定义了不同的层次。特性定义了工具集的子集,而层次则关系到计算方面的复杂程度。在这些特性中, “简单可视化特性”提供了容错(通过数据分割,RVLC,再同步标识和头部扩展编码等方式)和较低的复杂性,这对