1、1分布式视频编码中边信息的多策略优化摘要:本文主要研究分布式视频编码中解码边信息的生成问题,针对获取边信息所采用的不同方式进行比较,提出优化方法,以期获得较好性能的边信息。 关键词:视频编码;边信息;策略 中图分类号: TN941.2 文献标识码: A 一、分布式视频编码技术 分布式视频编码是以分布式信源编码(Distributed Source Coding, DSC)为理论基础的一种全新的视频编码方式。分布式信源编码是指分别对两个或两个以上的独立相关随机信号进行单独编码,而后每个编码器编码所得的比特流经过信道统一传送到解码端。解码端利用视频帧间的统计相关性对输入的比特流进行联合解码。分布式
2、信源编码理论包括 Slepian 和 Wolf 建立的分布式无损编码理论与 Wyner 和 Ziv 建立的仅在解码端获得边信息的有损编码理论。 二、边信息生成算法的研究 (一)平均内插法 该方法就是将前后关键倾的解码帧对应像素值求平均的结果作为边信息的像素值。即: 其中 X2k-1(i,j)表示该 WZ 帧相邻的前一解码关键帧位置(i,j)上2的像素值,表示该 WZ 帧相邻的后一解码关键帧位置(i,j)上的像素值。该边信息生成算法方法有很多优点,首先该方法比较简单,由于没有使用运动估计、补偿等运算,所以运算的复杂度不会很高;同时对于运动比较平稳的图像序列 WZ 帧和 K 帧之间相关性比较高,这
3、种方法生成的边信息作为 WZ 帧估计还是比较准确的。但是这种方法也有很多缺点,对于运动比较剧烈、低速率的图像序列该方案产生的边信息质量不一定会好。如图 1 所示为 Foreman 视频序列的第 72 帧,通过采用平均内插法产生的该顿边信息图(b)可以看出产生的边信息比较模糊,并且经过计算该边信息 PSNR 只有 25.2962,利用这样的边信息译码重建的 WZ 帧性能就会不好。图 1(a) Foreman 序列第 72 帧 (b)平均内插法 72 帧的边信息 (二)运动补偿算法 运动补偿法认为插值顿是其前面参考帧按照某个运动矢量经过帧间平移得到。通过一些算法获知两个参考之间运动矢量的过程称为运
4、动估计,将参考帧按运动估计获知的运动矢量经过顿间平移的方法获得当前帧的预测顿即插值帧的过程称为运动补偿。运动补偿算法的理论基础是认为 i-1 时刻的图像与 i-2 时刻的图像之间的运动矢量和 i-1 时刻的图像与 i 时刻的图像之间的运动矢量是相同的。 (三)外推插值法 运动补偿外推(Motion Compensation Extrapolation, MCE)插值方法如图 2 所示,将解码端的 i-2 时刻对应解码帧作为参考帧,并将该参3考帧分成很多个大小相同没有重叠的块,如图中 Xi-2 即为其中一块,对于每个块可以按照式(1)绝对误差和(Sum of Absolutely Differe
5、nce, SAD)或者第三章中米用过的平均绝对差 MAD 最小的要求在 f-1 时刻解码喊中找到最匹配的块,因为 SAD 省去了乘法运算,所以被本文所釆用。假设找出最匹配的块为图中 Xi-1,这时可以求出这两个块之间的相对位移即为运动矢量 V1,这时认为 Xi-1 是 Xi-2 按运动矢量 V1 经过顿间平移得到的,并认为 Xi-1 与 i 时刻插值帧之中最匹配块 X1 之间的运动矢量 V2=V1,将 Xi-1 按运动矢量 V2 平移到插值顿对应的位置上完成对插值顿的运动补偿计算。这时 X,块中位置(a,b)上的像素值可以通过式(2)计算得到: (1) (2) 采用这种方法得到的边信息质量的会
6、逐渐下降,但是运动补偿外推法能够满足低延时解码要求。 (图 2 MCE 边信息生成示意图) (三)运动补偿内插法 运动补偿内插算法(Motion Compensation Interpolation, MCI)将需要解码的 WZ 帧前后相邻解码帧作为参考信息,经过运动补偿内插产生需要解码 WZ 顿的边信息。假设待解码 WZ 帧的前一解码帧为 F2i-1,后一解码帧为 F2i+1,将 F2i+1 视为参考帧,即认为尸 F2i-1 是 F2i+1 按照某一运动矢量经过运动补偿得到的。下面介绍求得厂 F2i-1 和 F2i+1 之间4运动矢量的过程,首先将分成大小都为 m x m,没有重叠的图像块,
7、在F2i+1 帧中以相同位置的图像块为中心开辟出一个大小为(m + n)x(m + n)的图像块,如图 3 中 m=8, n=4,对于边缘块可以米用补零或者加权平均法补齐元素;然后,在这样的区域中,按照 m x m 的大小,依据 SAD 或者 MAD最小准则,搜索出与 F2i-1 中块最匹配的块;最后求出这两个图像块之间相对位移,即为运动矢量 NVb=(Vx,Vy) ,这时认为块之间的运动属于线性运动,所以可以得知当前帧 F2i 与 F2i+1 之间的运动矢量为 F2i-1与 F2i+1 之间的一半,即为 MVb/2。于是待解码帧 F2i 的预测帧 SIb 中位置(a,b)上的像素值就可以由式
8、(3)计算得到: (3) (图 3 m=8,n=4 MCI 的搜索区域) 上述 MCI 算法中只进行了一次后向的运动补偿,如图 4 所示,与后向 MCI 算法类似,此刻将 F2i-1 作为参考顿,将 F2i+1 很多个图像块,在 F2i-1 中开辟出的搜索区域中找出最匹配的块,并求出前向运动向量MVf =(Vx,Vy)利用 MVf 同样可以求出一个预测帧,同样待解码帧 F2i前向运动补偿的预测帧 SIf 中位置(a,b)上的像素值就可以由式(a.b)计算得到: (4) 通过上面分析可以知道预测帧都是通过块的插值产生的,所以最终插值帧会出现块的重叠还会出现空白的区域。对于最终边信息的生成,该文献
9、采用下面的方法:和都为非空白的区域,最终预测帧该位置的像5素值取两者的平均,如下式所示: (5) Slf 中为空白的像素点用 SIb 中该位置的像素值代替;SIb 中为空白的像素点就用 Slf 中该位置的像素值代替;对于两顿中都为空白的像素点(该区域是非常小的) ,就直接用 F2i-1 对应的像素值代替。 (图 4 双向 MCI 示意图) MCI 方法由于利用了前后两顿作为参考信息,所以边信息生成质量显然要比 MCE 方案好。但是如图 5 所示,同样是 Foreman 视频序列第 72 帧图像经过双向 MCI 产生的边信息,从图中可以看出生成的边信息有很明显的块效应现象,图像的视觉效果比较差。
10、虽然通过减小匹配块的大小可以某些程度消除块效应现象,但是块过小又会导致误匹配的现象出现,所以运动补偿算法弊端也是很明显的。 (图 5 双向 MCI 法第 72 帖的边信息) 下面分别对 Mobile 和 Foreman 序列的前 101 帧采用上一节中介绍的平均内插和双向运动补偿内插法生成 WZ 顿的边信息,实验结果如图 6 和7 所示。运动补偿算法将一顿划分成 8x8 大小的图像块,搜索区域大小选择为(8+4)x(8+4),图像边缘块没有的部分釆用补零的方法。对实验数据统计表明:在 Mobile 50 帧 WZ 帧中,采用平均内插算法产生的边信息较双向运动补偿内插算法产生的边信息的 PSNR
11、 高的有 42 帧;而 Foreman序列则不然,该序列中有 29 帧双向运动补偿算法产生的边信息 PSNR 值6要高于均内插算法。由于 Foreman 视频序列较 Mobile 视频序列运动更为剧烈,所以根据前面分析可以知道运动补偿算法更适用于运动较为剧烈的视频序列,而平均内插法则更适合运动比较缓慢的序列。通过图中可以发现对于运动不是很剧烈的 Mobile 序列无论何种方法生成的边信息PSNR 都比较低,这是因为 Mobile 序列是纹理特别丰富的视频序列,所以即使很小的运动也会导致生成的边信息的 PSNR 值变得较低。 (图 6Mobile 序列平均内插与双向 MCI 生成方案的 PSNR
12、 曲线) (图 7Foreman 序列平均内插与双向 MCI 生成方案的 PSNR 曲线) 三、边信息更新法 通过以上介绍可以知道无论是平均内插算法还是运动补偿算法产生的边信息一旦生成就会成为一个固定的值来完成 WZ 帧所有比特平面的译码,这样就不能利用已经解码成功的比特平面来提高边信息的质量,从而提高整体的系统性能。所以在平均内插和运动补偿内插算法的基础上研究了一种新的边信息生成算法。这种边信息生成方案是一种动态边信息提纯的方案。与将一顿图像划分成很多图像块的来实现自适应量化参数选择的处理方法不同,该边信息生成方案都是针对一顿图像的数据进行均匀量化,并抽取若干比特平面来完成后续系统的编解码。
13、如图 8 所示,首先,解码端依据视频序列的特点选择较好的边信息生成方案产生初始边信息 Y(0),通过上一节仿真分析可以知道,如本章的 Mobile 视频序列更适合釆用平均内插算法,而 Foreman 视频序列则更适合采用双向7运动补偿内插算法,这样可以使产生的的初始边信息的质量较好;然后,利用这个边信息 Y(0)完成对该 WZ 帧第一比特平面的译码,接下来并没有立即对第二比特平面进行译码,而是利用第一个比特平面译码的结果,按 m=l(即抽取一个比特平面)的情况结合边信息按照重建算法完成对该帧的第一次重建,将重建的结果 X(1)作为译码第二比特平面的边信息Y(1),对第二个比特平面的进行译码,接
14、着重建算法按 m=2 的情况完成对 WZ 帧的第二次重建,获得第二次提纯的边信息 X(2) ,依此类推;最后对抽取的 m 个比特平面,进行重复的译码和重建,完成 m-l 次边信息的提纯最终得到该 WZ 顿的重建结果 X1。这种基于比特平面的边信息更新算法通过利用前面已经正确译码比特平面的结果来完成对初始边信息的不断更新,这种方案在以往只利用已经解码的相邻帧产生边信息的基础上,又充分利用本倾图像己经正确译码的比特平面来不断提高系统性能。这种通过不断提高边信息与 WZ 顿的“相似度”来提高后续比特平面的译码性能的效果是显而易见的。 (图 8 边信息更新算法的实现过程) 分布式视频编码具有编码简单、压缩率高、抗误码能力强等特点,因而得到了广泛的发展与应用,同时取得了大量的研究成果。然而与传统视频编码技术(H.264/AVC 等)相比,分布式视频编码还有一定的差距,有待进一步研究改进。 参考文献: 1卿粼波,何小海,吕瑞,曾强宇. 分布式视频编码中边信息的多策8略优化J. 四川大学学报(工程科学版),2008,01:138-143. 2史萍,罗坤. 分布式视频编码中边信息的产生J. 电视技术,2010,11:27-29+47. 3张晓星,刘冀伟,胡广大,崔朝辉. 分布式视频编码中的边信息改进算法J. 计算机科学,2011,11:275-277+295.
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。