1、毕业论文文献综述 电子信息工程 可伸缩性图像编码方法的综述 摘要 : 为了提高图像质量并获得更高的编码效率,提出一种基于感兴趣区域 (ROI) 实现可伸缩编码的方法。在编码时结合基于 ROI 对象的动态 FMO,满足了编码效率和容错性能的折衷。同时,结合 FMO 特性实现对增强层的感兴趣区域的优先传输,提高了图像质量和码流的可伸缩性。 关键词 : 图像压缩;可伸缩视频编码 ; 感兴趣区域 ;FMO; 1 引言 由于网络带宽的波动性,异构性,以及传输的不可靠性等特点,网络视频编码及传输受到了前所未有的挑战与考验。在复杂的网络环境中 ,提供具有良好的压缩比、容错性和伸缩性的视频码流,来适应有限的终
2、端处理能力和不断变化的用户需求,成为视频研究中的核心问题和经典问题之一。目前,可伸缩视频编码可以较好的解决这一问题。可伸缩视频编码能够动态的适应网络带宽的变化,具有良好的鲁棒性来抵制数据信息的丢失。 当前 , 可伸缩性视频编码技术是 H.264/AVC 的基础上的扩展 , 其目标是具有与 H.264相似的编码效率、相似的解码复杂度以及相似的重建质量 , 它具有H.264/AVC 的所有的特点 , 只是为了增加可伸缩功能增加了与之相对的一些工具而已。 2 图像 压缩 自 1948 年提出的电视信号数字化设想后 ,即开始了图像压缩的研究,到现在已有 50 多年的历史。 20 世纪五六十年代的图像压
3、缩编码主要集中在预测编码、哈夫曼编码等技术的研究 ,还不成熟。1969 年在美国召开的第一届“图像编码会议”标志着图像编码作为一门独立学科的诞生。到了七八十年代 ,图像压缩技术的主要成果体现在变换编码技术上 ,矢量量化编码技术也有较大的发展 1。 80 年代末 ,小波变换理论、分形理论、人工神经网络理论、视觉仿真理论建立 ,人们开始突破传统的信源编码理论 ,图像压缩编码向着更高的压缩率和更 好的压缩质量的方向发展 ,进入了一个崭新的发展时期。 ( 1) 哈夫曼编码 哈夫曼编码是由哈夫曼在 1952 年提出的一种编码方法。这种方法是根据信源中各种符号出现的概率进行编码,出现概率越高的符号为其设计
4、的码字越短,出现概率越小的符号,则对应的码字越长,从而达到较少的平均码长。理论研究表明,哈夫曼编码是接近于信源熵的编码方法 2。因为哈夫曼编码较为简单有效 ,所以得到了广泛的应用。但是产生哈夫曼编码要对原始数据扫描两遍,数据压缩和还原速度都较慢。另外哈夫曼编码对于位的增减都反应敏感。 ( 2) 算术编码 算 术编码完全抛弃了用特殊字符代替输入字符的思想。在算术编码中,输入的字符信息用 0 到 1 之间的是数进行编码,它用到两个基本的参数:符号的频率及其编码间隔。对于输入的字符信息,算术编码后形成一个唯一的浮点数 3。算术编码的特点是 (1)算术编码在自适应模式下,不必预先统计符号概率( 2)当
5、信源个符号的概率比较接近时,算术编码的效率优于哈夫曼编码( 3)算术编码的实现比哈夫曼编码复杂一些 3。 ( 3)离散余弦变换( DCT) 对于像素间呈现高度相关的典型图像, DCT的性能与 KLT的性能没有实质的区别。 DCT的快速实 现算法也已经实现。与 Walsh-Hadamard变换相比, DCT具有更强的信息集中能力,并且易于软硬件的实现,正是由于这些优点, DCT已经成为当前图像压缩中应用最广泛的技术 4。 ( 4) 预测编码 预测编码的理论基础是现代统计学和控制论。预测编码是根据某一模型利用以往的样本值,对于新样本值进行预测,然后将样本的实际值与其预测值相减得到一个误差值,对这一
6、误差值进行编码,如果模型足够好且样本序列在时间上的相关性较强,那么误差信号的幅度将远小于原始信号,从而可以用较少的数据类对其差值量化得到较大的数据压缩结果。 现在常用的方法是差分脉冲编码调制( DPCM)法 5。利用预测编码的方法压缩图像数据的空间和时间冗余性,这种方法直观、简捷、易于实现,它的不足在于压缩能力有限。 3 可伸缩编码 可伸缩编码能够满足在给定的码率范围内编码,使视频的质量尽可能优化,而且在解码端可以通过任意截断码流进行解码。 可伸缩视频编码技术包含多个方面的可伸缩性 ,其中最重要包含 3 个方面 : 时间可伸缩、空间可伸缩、质量可伸缩方面 6。 3、 1 时间可伸缩 时间可伸缩
7、指的是将原始的帧率序列根据需要下取样为一系列下降的帧率序列。其在 H.264/AVC 的 SVC 扩展中 ,其时间可伸缩性可以通过两种技术来实现 : 分级 B 帧编码结构和运动补偿的时间滤波 (MCTF)。这两种技术都内在地提供了时间可伸缩性 , 相比而言分级 B 帧的编码效率要高于运动补偿的时间滤波 (MCTF), 其主要原因是 MCTF 不补偿重建帧的量化错误 7。因此 , 分级 B 帧作为可伸缩编码的标准编码形式。 3、 2 空间可伸缩 空间可伸缩性指的是基本层和增强层的帧只是大小不同 , 增强层帧和对应基本层帧组成接入单元 (access unit), 如果以接入单元为单位来编码的话则
8、其编码顺序跟上一节 的编码顺序完全相同 ,,只是在每个接入单元中 , 总是从基本层帧到增强层帧的顺序来编码的 8。其编码方式除了 H.264 的编码方式外 , 还增加了一个利用基本层的上取样帧作为参考帧来预测 , 这个过程称为层间预测。 3、 3 质量可伸缩 质量可伸缩性编码可以认为是一种特殊形式的空间可伸缩性编码 , 它的基本层和增强层具有同样的大小 , 只是视觉质量不同而已。质量可伸缩性主要包含两种类型 : 粗粒度质量可伸缩性编码(CGS)、中间粒度的质量可伸缩 (MGS)。 CGS 的编码方法跟空间可伸缩编码有很多相似之处 , 跟空间可伸缩编 码方式有所不同的是它没有使用上取样 , 没有
9、对基本层的 Intra 编码宏块进行去块效应并且是在系数上处理 7。在每个增强层中 , 首先对下面所有层的残差值进行反量化累加得到参差和 , 然后求增强层残值与参差和的差值 , 最后使用反复递减量化步长大小的方法生成多个连续的 SNR 层。 4 感兴趣区域( ROI)编码方法 分 在对具有 ROI 的图像编码时,首先进行小波变换和量化。在熵编码前,编码器扫描量化系数,并选择一个缩放值,使得 ROI 的最小非零系数大于背景区的最大系数,对应 ROI 的小波系数被放大,使得属于这些系数 的所有的比特位放于比其它系数的比特位更高的位平面上 9。在对小波系数进行熵编码时, ROI 系数的所有比特都比
10、BG 系数的比特更早的放在了码块位流中。当码块位流插入到渐进层码流中时, ROI 信息就会比背景区的来得更早 10。每一片和每一分量的缩放值都包括在码流中 ,但不包括 ROI 的形状信息。 4、 1 基于 ROI的 2D控制图像编码 基于对象的精细可伸缩性编码算法,结合了位平面编码与对象编码技术,具备精细可伸缩性和灵活控制性两大特性。由于该算法具有同时在横向 (对象优先级 )和纵向 (位平面 )控制感兴趣区域的特点, 故将其简称为 2DROI11。算法将图像编码成基本层和增强层,基本层采用基于 DCT 变换的非伸缩性编码,而增强层采用基于对象的位平面编码。在进行位平面编码前,首先需要对图像进行
11、对象 (10, image object)分割及优先级排序,在进行位平面编码时可以有选择的采用选择性增强 (SE,selective enhancement)技术 11。它通过提升位平面来突出用户感兴趣区域,从而使得该区域能够优先编码,进而优先传输和解码,解码是编码的逆过程。指定对象优先级与选择性增强技术均能控制所感兴趣的区域,如果将两 者结合,则使得对感兴趣区的控制更为灵活,这也是该算法与 JPEG2000的不同之处 11。 4、 2 基于 ROI编码的干涉超光谱图像近无损压缩 成像光谱仪主要有三种类型:色散型、干涉型和计算层析型。其中,干涉成像光谱仪也称 Fourier变换成像光谱仪。干涉
12、成像光谱仪与其它成像光谱仪一样,在获得目标空间信息的同时,还获得目标的光谱信息。结合 ROI(感兴趣区域 )技术和有效的像素补偿策略,可以实现干涉图像的近无损压缩。 其中的一种小技巧 -帧内差值变换方法,可以将图像的压缩比提高 10% 2O%。帧内差值变换后,在进 行整数小波变换,以进一步的去除干涉图像的帧内相关性 12。 5 总结 本人介绍了一些基本的图像编码方法,其中包括 哈夫曼编码、算术编码、 离散余弦变换( DCT)、预测编码等一些经典的图像编码方法。以及可伸缩编码的其中 3个方面:时间可伸缩、空间可伸缩、质量可伸缩,分别说明了这 3个方面的基本原理以及各自的不同。还介绍了感兴趣区域(
13、 ROI)编码方法的其中 2种方法的基本原理和基本的过程。 参考文献 1 张连俊 彭荣群 . 图像压缩编码方法分析 J. 中国有线电视 . 2004, 6, 18(5): 15 17. 2 潘月秋等 . 图像数据压缩技术的原理及方法 J. 齐齐哈尔大学学报 , 2004, 11, 12(4): 2224. 3 何业军 陈永秦 . 数据编码与压缩技术 J. 电信快报 , 2001, 6, 8(5)33 35. 4 赵耀等 . 数据压缩讲座 第五讲 数据压缩的最新进展 J. 中国数据通信网络 , 2000, 7, 12(7): 21 22. 5 黄伟,龚沛曾 . 图像压缩中的几种编码算法 J. 计
14、算机应用研究 , 2001, 7, 8(2): 11 12. 6 费伟 , 朱善安 . 基于 H.264 的自适应可伸缩编码研究 J. 光电工程 , 2008, 9, 35(3): 102107. 7 LEE, Y X, LIU H C, TSAI T H. The bidirectional-based Structure for hierarchical B frame in scalable video codingC. Fujian: ICCCAS, 2008, 9, 11(5): 807 810. 8 SCHWARZ H, MARPE D, WIEGAND T. Overview o
15、f the scalable video coding extension of the H.264/AVC standardJ. IEEE Trans. Circuits Syst. Video Technol, Special Issue on Scalable Video Coding, 2007, 8, 17(9):1103 1120. 9李苏梅 ,韩国强 . 感兴趣区域的确定及相似度计算方法 J. 湖南工业大学学报 , 2008, 5, 4(4): 22 23. 10王冬 ,杜扬 ,孙鑫 ,李康宁 . 基于感兴趣区域及 LOD模型的图像压缩算法研究 J. 后勤工程学院学报 , 2007, 3, 3(3): 13 15. 11 陈志国 徐春环 . 图像编码的研究和应用 J. 中华现在影像学杂志, 2005, 4, 2(4): 7 10. 12 索辉,张晓冰 . 基于 JPEG2000的感兴趣区域编码 J. 哈尔滨理工大学学报 , 2008, 13(5): 28-31.