对象基嵌入式图像编码中的码率控制算法研究【毕业论文】.doc

上传人:文初 文档编号:280925 上传时间:2018-08-23 格式:DOC 页数:30 大小:1.08MB
下载 相关 举报
对象基嵌入式图像编码中的码率控制算法研究【毕业论文】.doc_第1页
第1页 / 共30页
对象基嵌入式图像编码中的码率控制算法研究【毕业论文】.doc_第2页
第2页 / 共30页
对象基嵌入式图像编码中的码率控制算法研究【毕业论文】.doc_第3页
第3页 / 共30页
对象基嵌入式图像编码中的码率控制算法研究【毕业论文】.doc_第4页
第4页 / 共30页
对象基嵌入式图像编码中的码率控制算法研究【毕业论文】.doc_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、 本科毕业设计 ( 20 届) 对象基嵌入式图像编码中的码率控制算法研究 所在学院 专业班级 电子信息工程 学生姓名 学号 指导教师 职称 完成日期 年 月 - 1 - 摘 要 在计算机多媒体技术的不断发展的时代,当存储和传输大量的图像数据时,图像压缩将起到越来越重要 的作用。嵌入式编码是一种全新的编码方式,它可以提供某种程度上的可伸缩性。嵌入式编码特别适合于容易产生误差的环境,也可以应用于网络,图像浏览,无线传输。嵌入式编码随着接收比特的增多,原来的图像可以逐步被恢复。当然嵌入式的编码器可以通过监视编码的一些参数,在满足目标比特率或者减少误差的情况下,在任何一点终止编码。同样解码器也可以在任

2、何一点截断比特流,重构图像。 本文是结合率失真优化( PCRD)算法在对象基嵌入式编码原理之上实现了一种新的对象基嵌入式图像编码( EOCOT)的码率控制算法。它是根据人的视觉感知特性, 以不同视觉对象为基本码率控制单元进行的编码。 该算法先 将图像先进行分割得到不同的视觉对象,并把原始图像通过直流( DC)变换和离散小波变换( DWT)。再 依据图像总目标码率和小波子带重要性,预先分配子带目标码率。然后,以小波子带为码率控制单元,运用率失真优化的思想对子带内对象码流进行优化截取和重新组装,并完成码率控制过程。仿真实验结果表明,本文实现的算法可以有效的实现编码前预分配子带码字。同时,在不同码率

3、要求下,能够得到不同质量的解码恢复图像,实现有效的码率控制过程。 关键词: EOCOT 编码; PCRD 算法; DC 变换; DWT 变换 - 2 - Abstract With the development of Multimedia technique, image compression plays a very important role in the storage and mass image data.Embedded image coding is a new coding method, it also can provide the possibility to re

4、construct reproductions of the image better and better as the coding image bit stream is received more and more. Embedded image coding is especially fit for the fallible and changeful environment, such as Internet/wireless transmission, image browse and so on. The output bit stream of the embedded c

5、ode can be truncated and the images for practical applications. It can be reconstructed to achieve varying degrees of scalability and different target bit rates or distortion. Based on rate distortion optimization (PCRD) algorithm and object proposed embedded coding principle, a new rate control of

6、object embedded image coding (EOCOT) was proposed. It is according to the visual perception, using different visual object properties for basic code of rate control to coding. The algorithm obtain the different visual object and the original image through the image segmentation. The original image m

7、ade by direct current (DC) transform and discrete cosine transform (DWT). It preassign sub-band object code rate according to code-rate of the total target image and wavelet sub-band importance. Then, based on wavelet sub-band code-rate control unit, the inner object code flow interceptioned and rea

8、ssembled using rate distortion optimization, to complete code rate control process. Simulation experiment result shows that this algorithm can effectively achieve the realization before encoding with subband. Meanwhile, in different bit rate request, can get different quality decoding recovery image

9、, realize effective bit rate control process. Key Words: EOCOT code; PCRD algorithms; DC transform; DWT transform - 3 - 目 录 1 引言 . 错误 !未定义书签。 2 图像及其编码方法 .2 2.1 图像基本概念 .2 2.2 图像编码方法 .2 2.2.1 熵编码 .2 2.2.2 预测编码 .3 2.3 嵌入式图像编码 .4 3 码率控制算法 .5 3.1 码率控制算法的基本概念 .5 3.2 JPEG2000 中的码率控制算法 .5 4 对象基 嵌入式图像编码中的码率控

10、制算法 .7 4.1 对象基嵌入式编码 .7 4.2 率失真优化算法 .7 4.3 算法步骤 .8 4.3.1 子带预分 配目标码字 .9 4.3.2 熵编码 .10 4.3.3 更新总目标码率 . 11 5 实验结果 .12 6 结论 .14 致谢 .15 参考文献 .16 附录 1 算法源程序 .18 附录 2 科研论文 .21 - 1 - 1 引言 近年来,越来越多 基于小波变换的 嵌入式图像的编码方法不断被提出,如 内嵌零树 (EZW)编码方法、基于分层树集合分割 (SPIHT)编码方法以及嵌入式最优截断块 EBCOT编码方法 1。嵌入式编码能够实现一次压缩,而解压重建出多幅不同质 量

11、和分辨率要求的图像 2。 传统 EBCOT算法是一种基于码块的优化截取嵌入式编码方法,它没有利用人的视觉感知特性对整张图像采用相同的编码策略,因此难以获得与主观视觉感知相匹配的结果。为了改进 EBCOT算法中存在的不足, 提出一种基于对象的优化截取嵌入式编码( EOCOT)算法。该算法是 基于对象的一种编码方法,也 是一种新颖的尺度可伸缩的图像压缩算法 ,除了保持很高的压缩效率和信噪比( SNR)可伸缩性外,还增加了分辨率可伸缩性和支持 ROI(感兴趣区域)编码特性。本文就是在研究现有的 EBCOT算法基础上 ,实现一种基于对 象的优化截取嵌入式编码( EOCOT)算法 3。 该算法的特点是

12、考虑人的视觉感知特性,并以不同视觉对象为基本编码单元, 可以采用不同的嵌入式编码策略对视觉对象进行独立编码,最终生成各自独立码流。 研究 EBCOT 算法中的码率控制过程, 需要在给定的目标码率下,考虑视觉对象 压缩码流的优化截取及重要对象的优化传输的问题 。 EBCOT 算法能够实现图像压缩的空间分辨率渐进性和 SNR 渐进性。该算法采用率失真优化的码率控制算法,根据不同子带内的码块产生的比特流长度不同,对恢复图像质量的贡献不同,对所有码块编码完成后,进行率失真 优化处理,比特流重新组装就可得到最终压缩码流。 该 过程是在 T1 编码后进行的,所以被称为 压缩后率失真优化( PCRD)算法。

13、 针对 EOCOT是基于对象编码的这个特点,本文将 PCRD算法思想运用到对象基嵌入式编码中,实现一种新的对象基嵌入式图像编码中的码率控制算法。该算法采用预先分配子带目标码率的方法,以子带为码率控制单元,依据对象的视觉感知特性和重要性,采用率失真优化的思想,并 对子带内的对象码流进行优化截取和重新组装,从而实现有效的码率控制过程。 - 2 - 2 图像及其编码方法 2.1 图像基本概念 图像是客观世界能量或者状态以可视化的形式在二维平面上的投影,是社会生活中常见的一种信息媒体,也是人类从外界获取原始信息的主要途径 4。随着计算机计算、现代通信技术,在技术、网络技术和信息处理技术的发展,人类进入

14、了信息化社会,图像作为人类最重要的信息载体,更是成为信息时代必不可少的要素。 数字图像常用一个数值的方式来表示一个图像。数字图像是图像的数字表示,像素是最小的单位。黑白图像也称为二值图像,是指图像的每一个像素只能是 0 或者 1,也就是黑或者白,没有中间的过度。彩色图像是指每个像素的信息由红绿蓝 ( RGB)三原色构成的图形,其中的三原色可以由不同的灰度级来描述的。但灰度图像没有彩色信息,图像的每个像素的信息是用一个量化的灰度级来描述的。 图像信号的的数字处理技术,也称为数字图像信息处理技术,最常见的是用计算机对图像进行处理。图像信息处理的方法主要有:图像变换、图像增强、图像复原、图像压缩和图

15、形重建。 2.2 图像编码方法 图像编码是指在满足一定的质量信噪比的要求或主观评价得分的条件下,用比较少的比特数表示图像或图像中所包含信息的一种技术。 衡量图像编码的指标 是 平均每个样本 中 的编码比特数,这一 数值的降低取决于编码方案是否能充分地去掉相关性。由于实际图像是一个非平稳 的 过程,它的局部统计相关性 会 随着图像各局部内容细节及活动量而变化。 而 自适应图像编码 则 能够根据图像局部统计相关性的变化,自动采用不同的参数甚至 能 在不同的图像编码方案间切换,从而做到充分去除图像每一局部范围内的相关性。 2.2.1 熵编码 熵编码是一种无损编码,它是基于信号特性的一种编码技术。熵编

16、码解码后- 3 - 能无失真的恢复原始图像,其基本原理是给出概率较大的符号一个短码字,而给出概率小的符号一个长码字,这样能够使得最终的平均码长较小。 有香农信息定论可知:图像的熵值是在保存信息量的前提下进行编码的每像素平均码元数的下限,这种信息熵保持编码叫熵编码 5。 ( 1) 哈夫曼编码 1952年哈夫曼提出了一种编码方法,即哈夫曼编码。哈夫曼编码与信源熵的编码方法是十分相近的。它是根据信源中各种符号出现的概率进行的编码,出现概率越高的符号其码字越短,出现概率越小的符号,则对应的码字就越长,从而实现较少的平均码长。因为哈夫曼编码较为简单有效 ,所以得到了广泛的应用。哈夫曼编码的缺点是对于位的

17、增减反应敏感,并且哈夫曼编码要对原始数据扫描两遍,以致于数据压缩和还原速 度就相对较慢。 ( 2)算术编码 在算术编码中,输入的字符信息是用 0到 1之间的数表示的,它用到符号的频率及其编码间隔这两个基本的参数。它是完全舍弃了输入的字符用特殊字符代替的思想。在算术编码后,对于输入的字符信息可形成一个唯一的浮点数。算术编码的缺点是实现比哈夫曼编码复杂一些。而优点是在自适应模式下,算术编码不必预先统计符号概率。算术编码的效率要优于哈夫曼编码,则就要使得信源中符号的概率比较接近。 ( 3)游程编码 游程编码是相比上述算法比较简单的一种编码技术,思路是将一个代表值和串长用一个相同 值的连续串来表示。在

18、进行图像编码时,游程直接定义特定方向上有着相同灰度的相邻元为一轮,它的延续长度称之为延续的行程。前一游程的中点位置确定了现在游程的中点位置,这样图像数据就可以由游程来代替。由于游程是一个变化的数值,并且各种长度的游程出现的频率不同,因此在许多场合下,采用哈夫曼编码对游程进行进一步的压缩,从而去除相关性,同时也提高了压缩比 6。 2.2.2 预测编码 预测编码是在现代统计学和控制论的理论基础上发展起来的。预测编码会根据某一模型利用以往的样本值,对新样本值进行预测,并把两者相减得到一个误- 4 - 差 值,最后对这一误差值进行编码。要想使误差信号的幅度远小于原始信号,就需要这一模型足够好且样本序列

19、在时间上的相关性较强,从而可以用较少的数据对其差值量化,最终得到较大的数据压缩结果。现在常用的方法是差分脉冲编码调制( DPCM)法。采用预测编码的方法来压缩图像数据的空间和时间冗余性,这种方法简捷、直观、易于实现,它的不足在于压缩能力有限 7。 2.3 嵌入式图像编码 嵌入式图像编码是随着图像编码技术的发展而产生的一种新的编码技术。嵌入式编码的基本原理是将待编码的比特流,按重要性不同进行排序,在给定目 标码率或失真度大小的条件下,随时截断比特流,并可以要求结束编码;同样的,对于给定码,解码器也能够随时要求结束解码,同时可以得到相应比特流截断处目标码率的重建图像 8。嵌入式编码的一般顺序是:先

20、通过线性变换将空域的图像数据阵映射到变换域中;然后把变换域中的像素连续的量化,并把量化的像素进行分类与排序;接着对码字进行熵编码;最后对码块数据进行优化处理。 通过小波变换后的一幅数字图像,可以得到不同子带内的小波系数。低频子带聚集了图像的大部分能量,也就是包含了图像的主要信息,因此它的小波系数很大;越是高频子带,它 包含的图像信息反而越少,其系数值也越小。即使在数值相同的情况下,图像的高频信息由高频子带反映,对视觉来说不太重要;对视觉比较重要的部分是由低频子带反映,它是图像的低频信息。因此,对相同数值的系数,我们一般会选择先传输较低频系数的重要比特,后传输较高频系数的重要比特。正是由于图像小

21、波系数具备了上述的这些特点,所以它非常适合于嵌入式的图像编码算法。 - 5 - 3 码率控制算法 3.1 码率控制基本概念 码率就是数据传输时单位时间传送的数据位数 ,一般我们用的单位是 kbps 即千位每秒。 码率控制则是通过一 定的编码措施,在给定的压缩率情况下,获得最佳重构图像质量 8。算法过程就是找到最优截断点集合,并对截断后的码流进行组织,最终得到较好的图像质量。码率控制是图像编码中的一项关键技术,编码时既要保证图像输出码率满足目标码率的限制,同时提供在该码率下图像重建质量的最优化效果。码率控制的目的是在满足特殊的目标比特率及传输时间要求的条件下,确保用指定码率编码下达到尽可能高的重

22、建图像质量。 码率控制算法一直以来就是研究人员十分关注的问题,其性能的优劣直接影响到图像、视频的重建质量,比如图像的客观评价指标峰值性噪比、主 观质量和图形延时与抖动等。一般的码率控制算法的实现主要是通过调节编码时量化参数QP的调整和编码后缓冲区充裕度。 就目前而言,码率控制算法一般分为算术编码器压缩后率控制和算术编码器与率控制同时进行两种 9。其中 PCRD 就是典型的压缩后率控制:先用算术编码进行编码,然后从所有编码码段中选择一部分(根据压缩需求)包含进最终码流。该方法是算术编码和码率控制前后进行,所以要编码所有的通道,具有很大的计算复杂度,这就适合应用于对图像质量要求很高或者具有很多质量

23、层的编码场合。 选择性算术编码是算术编码和 率控制同时进行的一种编码,此方法主要是不要求所有的通道都先经过算术编码,而是在进入算术编码的时候同时进行码率控制,当达到指定的码率控制的时候,系数就会停止进入编码。换句话说,它是选择一部分编码通道进行编码,并将其编码码流包含进最终码流。 3.2 JPEG2000 中的码率控制算法 JPEG2000 编码器中,码率控制可通过两种不同的机制实现:一是选择各子带系数的量化步长;二是编码位流的截断,即选择包括进输出码流中的编码位流。- 6 - 对于无损压缩编码而言,因为量化步长固定地设为 1,所以只能采用位流截断的方法实现 码率的控制。 JPEG2000 码

24、率编码的码率控制算法的改进有两种:带场景切换检测的两次扫描码率控制算法( TPSCD)和单缓冲多步长的码率控制算法( SBMS) 9。 TPSCD算法进行的第一次的编码扫描是以 CBR 编码方式进行的,然后将视频序列进行场景切换检测,从中得到若干个复杂度近似的场景组;同时从各场景组抽选若干个样本帧,利用 DBRC 算法 10将确定每个场景组目标码率,要想扫描得到最后的 VBR码流就得用 SBMS 算法对每个场景组的各帧进行第二次的编码。该算法特别适合应用于对视频转录系统的实时性要求 较低的情况。它也能够在相同码率下,使得输出视频质量较为为稳定,同时输出视频序列的 PSNR 方差 DBRC 算法有较大的改善。 SBMS 算法是利用视频相邻帧的帧间相关性,当前帧的率失真情况是用前一编码帧的率失真斜率值通过估计所得到的。想要有效的节省编码时间,改善输出视频质量的稳定性,就要知道预测邻近几帧的率失真截止门限。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。