可伸缩性图像编码方法的综述【文献综述】.doc

资源描述

1、毕业论文文献综述电子信息工程可伸缩性图像编码方法的综述摘要：为了提高图像质量并获得更高的编码效率，提出一种基于感兴趣区域 (ROI) 实现可伸缩编码的方法。在编码时结合基于 ROI 对象的动态 FMO，满足了编码效率和容错性能的折衷。同时，结合 FMO 特性实现对增强层的感兴趣区域的优先传输，提高了图像质量和码流的可伸缩性。关键词：图像压缩；可伸缩视频编码 ; 感兴趣区域 ;FMO; 1 引言由于网络带宽的波动性，异构性，以及传输的不可靠性等特点，网络视频编码及传输受到了前所未有的挑战与考验。在复杂的网络环境中，提供具有良好的压缩比、容错性和伸缩性的视频码流，来适应有限的终

2、端处理能力和不断变化的用户需求，成为视频研究中的核心问题和经典问题之一。目前，可伸缩视频编码可以较好的解决这一问题。可伸缩视频编码能够动态的适应网络带宽的变化，具有良好的鲁棒性来抵制数据信息的丢失。当前 , 可伸缩性视频编码技术是 H.264/AVC 的基础上的扩展 , 其目标是具有与 H.264相似的编码效率、相似的解码复杂度以及相似的重建质量 , 它具有H.264/AVC 的所有的特点，只是为了增加可伸缩功能增加了与之相对的一些工具而已。 2 图像压缩自 1948 年提出的电视信号数字化设想后 ,即开始了图像压缩的研究，到现在已有 50 多年的历史。 20 世纪五六十年代的图像压

3、缩编码主要集中在预测编码、哈夫曼编码等技术的研究 ,还不成熟。1969 年在美国召开的第一届“图像编码会议”标志着图像编码作为一门独立学科的诞生。到了七八十年代 ,图像压缩技术的主要成果体现在变换编码技术上 ,矢量量化编码技术也有较大的发展 1。 80 年代末 ,小波变换理论、分形理论、人工神经网络理论、视觉仿真理论建立 ,人们开始突破传统的信源编码理论 ,图像压缩编码向着更高的压缩率和更好的压缩质量的方向发展 ,进入了一个崭新的发展时期。（ 1）哈夫曼编码哈夫曼编码是由哈夫曼在 1952 年提出的一种编码方法。这种方法是根据信源中各种符号出现的概率进行编码，出现概率越高的符号为其设计

4、的码字越短，出现概率越小的符号，则对应的码字越长，从而达到较少的平均码长。理论研究表明，哈夫曼编码是接近于信源熵的编码方法 2。因为哈夫曼编码较为简单有效 ,所以得到了广泛的应用。但是产生哈夫曼编码要对原始数据扫描两遍，数据压缩和还原速度都较慢。另外哈夫曼编码对于位的增减都反应敏感。（ 2）算术编码算术编码完全抛弃了用特殊字符代替输入字符的思想。在算术编码中，输入的字符信息用 0 到 1 之间的是数进行编码，它用到两个基本的参数：符号的频率及其编码间隔。对于输入的字符信息，算术编码后形成一个唯一的浮点数 3。算术编码的特点是 (1)算术编码在自适应模式下，不必预先统计符号概率（ 2）当

5、信源个符号的概率比较接近时，算术编码的效率优于哈夫曼编码（ 3）算术编码的实现比哈夫曼编码复杂一些 3。（ 3）离散余弦变换（ DCT）对于像素间呈现高度相关的典型图像， DCT的性能与 KLT的性能没有实质的区别。 DCT的快速实现算法也已经实现。与 Walsh-Hadamard变换相比， DCT具有更强的信息集中能力，并且易于软硬件的实现，正是由于这些优点， DCT已经成为当前图像压缩中应用最广泛的技术 4。（ 4）预测编码预测编码的理论基础是现代统计学和控制论。预测编码是根据某一模型利用以往的样本值，对于新样本值进行预测，然后将样本的实际值与其预测值相减得到一个误差值，对这一

6、误差值进行编码，如果模型足够好且样本序列在时间上的相关性较强，那么误差信号的幅度将远小于原始信号，从而可以用较少的数据类对其差值量化得到较大的数据压缩结果。现在常用的方法是差分脉冲编码调制（ DPCM）法 5。利用预测编码的方法压缩图像数据的空间和时间冗余性，这种方法直观、简捷、易于实现，它的不足在于压缩能力有限。 3 可伸缩编码可伸缩编码能够满足在给定的码率范围内编码，使视频的质量尽可能优化，而且在解码端可以通过任意截断码流进行解码。可伸缩视频编码技术包含多个方面的可伸缩性 ,其中最重要包含 3 个方面 : 时间可伸缩、空间可伸缩、质量可伸缩方面 6。 3、 1 时间可伸缩时间可伸缩

7、指的是将原始的帧率序列根据需要下取样为一系列下降的帧率序列。其在 H.264/AVC 的 SVC 扩展中 ,其时间可伸缩性可以通过两种技术来实现 : 分级 B 帧编码结构和运动补偿的时间滤波 (MCTF)。这两种技术都内在地提供了时间可伸缩性，相比而言分级 B 帧的编码效率要高于运动补偿的时间滤波 (MCTF), 其主要原因是 MCTF 不补偿重建帧的量化错误 7。因此，分级 B 帧作为可伸缩编码的标准编码形式。 3、 2 空间可伸缩空间可伸缩性指的是基本层和增强层的帧只是大小不同，增强层帧和对应基本层帧组成接入单元 (access unit)，如果以接入单元为单位来编码的话则

8、其编码顺序跟上一节的编码顺序完全相同 ,，只是在每个接入单元中 , 总是从基本层帧到增强层帧的顺序来编码的 8。其编码方式除了 H.264 的编码方式外，还增加了一个利用基本层的上取样帧作为参考帧来预测，这个过程称为层间预测。 3、 3 质量可伸缩质量可伸缩性编码可以认为是一种特殊形式的空间可伸缩性编码，它的基本层和增强层具有同样的大小，只是视觉质量不同而已。质量可伸缩性主要包含两种类型 : 粗粒度质量可伸缩性编码(CGS)、中间粒度的质量可伸缩 (MGS)。 CGS 的编码方法跟空间可伸缩编码有很多相似之处，跟空间可伸缩编码方式有所不同的是它没有使用上取样，没有

9、对基本层的 Intra 编码宏块进行去块效应并且是在系数上处理 7。在每个增强层中，首先对下面所有层的残差值进行反量化累加得到参差和 , 然后求增强层残值与参差和的差值，最后使用反复递减量化步长大小的方法生成多个连续的 SNR 层。 4 感兴趣区域（ ROI）编码方法分在对具有 ROI 的图像编码时，首先进行小波变换和量化。在熵编码前，编码器扫描量化系数，并选择一个缩放值，使得 ROI 的最小非零系数大于背景区的最大系数，对应 ROI 的小波系数被放大，使得属于这些系数的所有的比特位放于比其它系数的比特位更高的位平面上 9。在对小波系数进行熵编码时， ROI 系数的所有比特都比

10、BG 系数的比特更早的放在了码块位流中。当码块位流插入到渐进层码流中时， ROI 信息就会比背景区的来得更早 10。每一片和每一分量的缩放值都包括在码流中 ,但不包括 ROI 的形状信息。 4、 1 基于 ROI的 2D控制图像编码基于对象的精细可伸缩性编码算法，结合了位平面编码与对象编码技术，具备精细可伸缩性和灵活控制性两大特性。由于该算法具有同时在横向 (对象优先级 )和纵向 (位平面 )控制感兴趣区域的特点，故将其简称为 2DROI11。算法将图像编码成基本层和增强层，基本层采用基于 DCT 变换的非伸缩性编码，而增强层采用基于对象的位平面编码。在进行位平面编码前，首先需要对图像进行

11、对象 (10， image object)分割及优先级排序，在进行位平面编码时可以有选择的采用选择性增强 (SE，selective enhancement)技术 11。它通过提升位平面来突出用户感兴趣区域，从而使得该区域能够优先编码，进而优先传输和解码，解码是编码的逆过程。指定对象优先级与选择性增强技术均能控制所感兴趣的区域，如果将两者结合，则使得对感兴趣区的控制更为灵活，这也是该算法与 JPEG2000的不同之处 11。 4、 2 基于 ROI编码的干涉超光谱图像近无损压缩成像光谱仪主要有三种类型：色散型、干涉型和计算层析型。其中，干涉成像光谱仪也称 Fourier变换成像光谱仪。干涉

12、成像光谱仪与其它成像光谱仪一样，在获得目标空间信息的同时，还获得目标的光谱信息。结合 ROI(感兴趣区域 )技术和有效的像素补偿策略，可以实现干涉图像的近无损压缩。其中的一种小技巧 -帧内差值变换方法，可以将图像的压缩比提高 10% 2O%。帧内差值变换后，在进行整数小波变换，以进一步的去除干涉图像的帧内相关性 12。 5 总结本人介绍了一些基本的图像编码方法，其中包括哈夫曼编码、算术编码、离散余弦变换（ DCT）、预测编码等一些经典的图像编码方法。以及可伸缩编码的其中 3个方面：时间可伸缩、空间可伸缩、质量可伸缩，分别说明了这 3个方面的基本原理以及各自的不同。还介绍了感兴趣区域（

13、 ROI）编码方法的其中 2种方法的基本原理和基本的过程。参考文献 1 张连俊彭荣群 . 图像压缩编码方法分析 J. 中国有线电视 . 2004, 6, 18(5): 15 17. 2 潘月秋等 . 图像数据压缩技术的原理及方法 J. 齐齐哈尔大学学报 , 2004, 11, 12(4): 2224. 3 何业军陈永秦 . 数据编码与压缩技术 J. 电信快报 , 2001, 6, 8(5)33 35. 4 赵耀等 . 数据压缩讲座第五讲数据压缩的最新进展 J. 中国数据通信网络 , 2000, 7, 12(7): 21 22. 5 黄伟，龚沛曾 . 图像压缩中的几种编码算法 J. 计

14、算机应用研究 , 2001, 7, 8(2): 11 12. 6 费伟 , 朱善安 . 基于 H.264 的自适应可伸缩编码研究 J. 光电工程 , 2008, 9, 35(3): 102107. 7 LEE, Y X, LIU H C, TSAI T H. The bidirectional-based Structure for hierarchical B frame in scalable video codingC. Fujian: ICCCAS, 2008, 9, 11(5): 807 810. 8 SCHWARZ H, MARPE D, WIEGAND T. Overview o

15、f the scalable video coding extension of the H.264/AVC standardJ. IEEE Trans. Circuits Syst. Video Technol, Special Issue on Scalable Video Coding, 2007, 8, 17(9):1103 1120. 9李苏梅 ,韩国强 . 感兴趣区域的确定及相似度计算方法 J. 湖南工业大学学报 , 2008, 5, 4(4): 22 23. 10王冬 ,杜扬 ,孙鑫 ,李康宁 . 基于感兴趣区域及 LOD模型的图像压缩算法研究 J. 后勤工程学院学报 , 2007, 3, 3(3): 13 15. 11 陈志国徐春环 . 图像编码的研究和应用 J. 中华现在影像学杂志， 2005, 4, 2(4): 7 10. 12 索辉，张晓冰 . 基于 JPEG2000的感兴趣区域编码 J. 哈尔滨理工大学学报 , 2008, 13(5): 28-31.

展开阅读全文