1、简述 MPEG 和 JPEG 的主要差别。答:MPEG 视频压缩技术是针对运动图象的数据压缩技术。为了提高压缩比,帧内图象数据和帧间图象数据压缩技术必须同时使用。MPEG 通过帧运动补偿有效地压缩了数据的比特数,它采用了三种图象,帧内图、预测图和双向预测图。有效地减少了冗余信息。对于 MPEG 来说,帧间数据压缩、运动补偿和双向预测,这是和 JPEG 主要不同的地方。而 JPEG和 MPEG 相同的地方均采用了 DCT 帧内图象数据压缩编码。在 JPEG 压缩算法中,针对静态图象对 DCT 系数采用等宽量化,而是 MPEG 中视频信号包含有静止画面(帧内图)和运动信息(帧间预测图)等不同的内容
2、,量化器的设计不能采用等宽量化需要作特殊考虑。从两方面设计,一是量化器综合行程编码能使大部分数据得到压缩;另一方面是通过量化器、编码器使之输出一个与信道传输速率匹配的比特流。详述 JPEG 静态图象压缩编码原理及实现技术。答:JPEG 是由国际电报咨询委员会(CCITT)和国际标准化协会(OSI)联合组成的一个图象专家小组开发研制的连续色调、多级灰度、静止图象的数字图象压缩编码方法。JPEG 适于静止图象的压缩,此外,电视图象序列的帧内图象的压缩编码也常采用 JPEG 压缩标准。JPEG 数字图象压缩文件作为一种数据类型,如同文本和图形文件一样地存储和传输。基于离散余弦变换(DCT)的编码方法
3、是 JPEG算法的核心内容。算法的编解码过程如教材 136 页图 4.25-4.26 所示。编码处理过程包括原图象数据输入、正向 DCT变换器、量化器、熵编码器和压缩图象数据的输出,除此之外还附有量化表和熵编码表(即哈夫曼表) ;接收端由信道收到压缩图象数据流后,经过熵解码器、逆量化器、逆变换(IDCT) ,恢复并重构出数字图象,量化表和熵编码表同发送端完全一致。编码原图象输入,可以是单色图象的灰度值,也可以是彩色图象的亮度分量或色差分量信号。DCT 的变换压缩是对一系列 8*8 采样数据作块变换压缩处理,可以对一幅像,从左到右、从上到下、一块一块(8*8/块)地变换压缩,或者对多幅图轮流取
4、8*8 采样数据块压缩。解码输出数据,需按照编码时的分块顺序作重构处理,得到恢复数字图象。具体的实现技术如下:(1) 首先把一幅图象分 8*8 的子块按图中的框图进行离散余弦正变换(FDCT)和离散余弦逆变换(IDCT) 。在编码器的输入端,原始图象被分成一系列 8*8 的块,作为离散余弦正变换(FDCT)的输入。在解码器的输出端,离散余弦逆变换(IDCT)输出许多 8*8 的数据块,用以重构图象。8*8 FDCT 和 8*8 IDCT 数学定义表达式如下:FDCT: v16)y2(cosu16)x2(cos)y,(f)v(Cu41)v,(F70x IDCT: v16)y2(cosu16)x2
5、(cos)v,u(fC)(41)y,x(F70uv 两式中,C(u),C(v)= , 当 u=v=02C(u),C(v)=1 , 其它情况离散余弦正变换(FDCT)可看作为一个谐波分析仪,把离散余弦逆变换(IDCT)看作一个谐波合成器。每个 8*8二维原图象采样数据块,实际上是 64 点离散信号,该信号是空间二维参数 x 和 y 的函数。FDCT 把这些信号作为输入,然后把它分解成 64 个正交基信号,每个正交信号对应于 64个二维(2D)空间频率中的一个,这些空间频率是由输入信号的频谱组成。FDCT 的输出是 64 个基信号的幅值(即DCT 系数) ,每个系数值由 64 点输入信号唯一地确定
6、,即离散余弦变换的变换系数。在频域平面上变换系数二维频域变量 u 和 v 的函数。对应于 u=0,v=0 的系数,称做直流分量(DC 系数) ,其余 63 个系数称做交流分量(AC 系数) 。因为在一幅图象中像素之间的灰度或色差信号变化缓慢,在 8*8 子块中像素之间相关性很强,所以通过离散余弦正变换处理后,在空间频率低频范围内集中了数值大的系数,这样为数据压缩提供了可能。远离直流系数的高频交流系数大多为零或趋于零。如果 FDCT 和 IDCT 变换计算中计算精度足够高,并且 DCT 系数没有被量化,那么原始的 64点信号就能精确地恢复。(2) 量化为了达到压缩数据的目的,对 DCT 系数 F
7、(u,v)需作量化处理。量化处理是一个多到一的映射它是造成 DCT 编解码信息损失的根源。在 JPEG 标准中采用线性均匀量化器。量化定义为,对 64 个 DCT 变换系数 F(u,v)除以量化步长Q(u,v)后四舍五入取整。即量化器步长是量化表的元素,量化表元素随 DCT 变换系数的位置而改变,同一像素的亮度量化表和色差量化表不同值,量化表的尺寸也是 64,与64 个变换系数一一对应。量化表中的每一个元素值为 1 至255 之间的任意整数,其值规定了对应位置变换系数的量化器步长。在接收端要进行逆量化,逆量化的计算公式为: ),(,),( vuQFvuQ不同频率的余弦函数对视觉的影响不同,量化
8、处理是在一定的主观保真度图像质量的前提下,可据不同频率的视觉阈值来选择量化表中的元素值的大小。根据心理视觉加权函数得到亮度化表和色度量化表。DCT 变换系数F(u,v)除以量化表中对应位置的量化步长,其幅值下降,动态范围变窄,高频系数的零值数目增加。(3) 熵编码为进一步达到压缩数据的目的,需对量化后的 DC 系数和行程编码后的 AC 系数进行基于统计特性的熵编码。64 个变换系数经量化后,坐标 u=v=0 的值是直流分量(即 DC 系数) 。DC 系数是 64 个图像采样平均值。因为相邻的 88 块之间有强的相关性,所以相邻块的 DC 系数值很接近,对量化后前后两块之间的 DC 系数差值进行编码,可以用较少的比特数。DC 系数包含了整个图像能量的主要部分。经量化后的63 个 AC 系数编码时从左上方 AC(u=7,v=7)开始,沿箭头方向,以“Z”字形行程扫描,直到 AC(u=7,v=7)扫描结束。量化后特编码的 AC 系数通常有许多零值,沿“Z”字形路径行进,可使零 AC 系数集中,便于使用行程编码方法。63个 AC 系数行程编码和码字,可用两个字节表示。JPEG 建议使用两种熵编码方法:Huffman 编码和自适应二进制算术编码。熵编码可分成两步进行,首先把 DC 和 AC 系数转换成一个中间格式的符号序列,第二步是给这些符号赋以变长码字。