1、课程设计说明书 第 I 页摘 要数字视频/音频压缩编码是数字电视广播系统中非常重要的环节,主要解决电视信号数字化后所带来的海量数据量如何能够有效地存储和传输的问题。近20 年来,视频/音频压缩编码技术一直处于快速发展之中,新技术和新标准不断涌现,现代视频/音频压缩编码技术已经比较成熟,可以在保持较好图像质量前提下,达到较高的压缩比。数字化技术的发展和成熟已使数字高清晰度电视(HDTV)成为现实。高清晰度电视是新一代电视,其扫描线在 1000 行以上,每行 1920 个像素,宽高比为 16:9,较常规电视更符合人们的视觉特性,使图像质量与 35mm 首映电影相当。但是由于像素数大幅度增加,使本来
2、数码位就较高的二进制编码形成极大的编码数据,使 HDTV 的信息量可达常规电视的 5 倍以上,传输时占用频带宽,存储时占用媒体容量大,特别是对计算量最为庞大的运动估算的运动算法来说,编码器无疑要有非常高的处理速度,这样给实际应用开发带来了极大困难。因此,必须对 HDTV 图像进行压缩编码。本文主要针对数字视频信号源的编码器和解码器的研究。关键词:视频/音频压缩编码技术 ,编码器,译码器课程设计说明书 第 II 页目 录1数字电视的优点和发展概况及其基本结构 .11.1 数字电视的优点和发展概况 .11.2 数字电视的基本组成 .32视频压缩编码的方法 .32.1 莫尔斯码与信源编码 .42.2
3、 差值脉 冲编码 .42.3 预测编码基本原理 .42.4 游程长度编码 .62.5 霍夫曼编码 .72.6 运动估计的运 动补偿编码 .83 MPEG-2编码器原理 .103.1 MPEG-2 的编码方式 .103.2 PAL 解码器 .133.3 MPEG-2 视频编码器 .144 MPEG-2解码器原理 .154.1 视频基 本码 流结构 .154.2 MPEG-2 解码 .16总 结 .17致 谢 .18参考文献 .19课程设计说明书 第 1 页1 数字电视的优点和发展概况及其基本结构1.1 数字电视的优点和发展概况数字电视是高科技的产物,数字电视是指电视节目的采集、制作、编辑、播出、
4、传输、接收的全过程都采用数字技术。与模拟电视相比,数字电视在技术上具有以下优势和特点: (1)、清晰度高、音频效果好、抗干扰能力强。数字电视信号在传输过程中不会出现噪声积累效应,几乎完全不受噪声干扰,电视信号的强度衰减与失真度很低,电视画面十分逼近演播室水平。数字电视的音频效果很好,支持五声道的杜比数码(AC-3)5.1 环绕立体声家庭影院服务; (2)、数字频道数成倍增加。基于现有模拟电视频道,可同时传输 6-8 套DVD 质量或 15-18 套 VCD 质量的数字电视节目。如全部采用数字电视技术传输,可同时传送大约 200 套 DVD 质量或 500 多套 VCD 质量的电视节目。电视频道
5、资源利用率高,可完全满足用户自由收看电视节目的个性化要求; (3)、数字业务功能极大拓展。随着有线电视传输和用户接收的数字化,以前模拟方式无法提供的服务都将成为可能,如电视网站、交互电视、股票行情与分析、视频点播等,电视互动数字新业务的开展将变得更加容易; (4)、数字电视信号容易加密,保密性好,便于采用现代数字信号处理。总之,数字电视替代模拟电视的趋势是现代科技发展的必然结果。 数字电视在我国具有强大的国家、政府支持和重视优势,就广播电视行业发展而言,数字电视技术为满足人民群众日益增长的精神文化需求提供强有力的技术和市场基础,为广播电视事业的大繁荣大发展带来了历史良机,因此受到广电行业的高度
6、重视和大力推进,并取得快速的发展。截止到 2008 年,全国有线数字电视整体转换城市超过 100 个,其中 33 个城市实现全市用户数字化整转,全国数字电视用户已达 4450 万户。 图 1.1 显示我国数字电视用户在 2003-2008 年间的快速发展规模和占全国电视用户量的比例,5 年用户增长了 158.9 倍,比例增长了 13 个百分点。图1.2、表 1.1 则给出了华北等六个地区 2007-2008 两年的数字电视用户及在本地课程设计说明书 第 2 页区所占图 1.1 2003-2008 年全国数字电视用户规模和所占比例图比例的发展情况,其中华北地区发展的最快提高了 12.9 个百分点
7、,西北地区提高了 11.7 个百分点,最少的东北地区也提高了 4 个百分点。另据国内 In-Stat 和络达咨询的研究报告,预计到 2009 年底我国数字电视规模将达 8522 万户,2010 年将达到 1.0284 亿户,2011 年将达到 1.1165 亿户,2012 年将达到 1.1606亿户。图 1.2 2007 年与 2008 年不同地区数字电视用户所占比例虽然我国数字电视在发展上具备很多优势,但与发达国家相比,我国数字电视整体上仍然处在发展的初期阶段,尚存在很多的问题。概括的说,有广电体制方面因素,条块分割、性质单一,既难统一规划、布局与实施,又难以引入市场竞争;有政策指导方面的因
8、素,地域差异经济发展不平衡导致受众需求课程设计说明书 第 3 页差别大而难以指导;有技术方面的缺乏配套齐全、规范和可操作的技术标准因素;有市场运营方面投、融资、运行成本高,难以短期盈利的因素;也有运营模式、产业规范、业务性质等等因素形成的问题。应该说我国数字电视的发展是机遇与挑战并存,只要我们按照科学规律办事,充分发挥中国特色社会主义的体制优势、行业优势、产业和市场优势,汲取发达国家发展数字电视所遇到的经验与教训,规避市场风险,就一定能推动我国数字电视的大发展。表 1.1 2007 年与 2008 年不同地区数字电视用户所占比较1.2 数字电视的基本组成交互式数字电视系统由三部分组成:数字前端
9、系统、双向传输网络和用户终端系统。数字前端系统通常划分为信源处理、信息处理和传输处理三部分,完成节目的数字化、加扰、授权和认证等功能;双向传输网络主要通过卫星、Cable、地面发射、MMDS 等方式将节目传送到用户家中,回传可采用 HFC 回传通道、PSTN 和其它网络;用户终端系统采用机顶盒(STB)收看数字电视节目或实现交互式功能,如收看付费电视、实现 Internet 浏览、远程教育等。课程设计说明书 第 4 页2 视频压缩编码的方法压缩编码的方法有几十种之多,并在编码过程中涉及较深的的数学里理论基础问题,在此仅介绍几种常用的压缩编码方法。2.1 莫尔斯码与信源编码莫尔斯码即电报码,其精
10、华之处在于用短码来表示常出现的英文字母,用长码来表示不常出现的字母,以减小码率。2.2 差值脉冲编码其原理框图见图 2.1(a)。发端将当前样值和前一样值相减所得差值经量化后进行传输,收端将收到的差值与前一个样值相加得到当前样值。在这个原理图中,输出的当前样值是输出的前一样值加上收到的差值,由于在当前差值中包括当前的量化误差,而输出的前一样值又包括前一样值的量化误差,这就造成了量化误差的积累。因此实用电路为图 2.1(b)。这时输入当前样值不是与输入的前一样值相减,而是与输出的前一样值相减,因此在差值中已经包含了前一样值的量化误差的负值,在与输出的前一个样值相加时,这部分量化误差被抵消,只剩下
11、当前的量化误差,这就避免了量化误差的积累。T T量 化量 化T储a储储b储T图 2.1 差值脉冲编码课程设计说明书 第 5 页2.3 预测编码基本原理由于语音信号的相邻抽样点之间有一定的幅度关联性,所以,可根据以前时刻的样值来预测现时刻的样值,只要传预测值和实际值之差,而不需要每个样值都传输。这种方法就是预测编码。语音信号的样值可分为可预测和不可预测两部分。可预测部分(相关部分)是由过去的一些权值加权后得到的;不可预测的部分(非相关部分)可看成是预测误差。这样,在数字通信中,就不用直接传送原始话音信号序列,而只传送差值序列。因为差值序列的信息可以代替原始序列中的有效信息,而差值信号的能量远小于
12、原样值,就可以使量化电平数减少,从而大大地压缩数码率。在接收端,只要把差值序列叠加到预测序列上,就可以恢复原始序列。图 2.2 给出了差值脉码调制(DPCM)系统原理框图。图中输入样值信号 ,接收端重建信号为 , 是输入信号与预测信号 的差值, 为量化后的差值, 是 经编码后输出的数字码。图 2.2DPCM 原理方框图编码器中的预测器与解码器中的预测器完全相同。因此,在无传输误码的情况下,解码器输出的重建信号 和编码器的 完全相同。DPCM 的总量化误差 定义为输入信号 与解码器输出的重建信号 的差值。即有由上式可知,在这种 DPCM 系统中,总量化误差只和差值信号的量化误差课程设计说明书 第
13、 6 页有关。图 2.3 说明了预测的原理。图 2.3 DPCM 预测原理由图 2.3 可见,预测值跟踪输入信号抽样值变化。DPCM 的方框图如图 2.3中,它是典型的线性预测方式。设原始信号序列 为,其中 是序列 中现在的样值,而 是 的前 个样值。若选用 的前 N 个样值来预测 ,并用 表示预测值,则其中,j 为任意整 数。 为预测系数或加权系数, 为预测阶 数。由上式可见,线性预测中,第 n 个预测值是过去 N 个样值的线性组合。2.4 游程长度编码读出数据和表示数据的方式也是减少码率的一个重要因素。读出的方式可以有多种选择 ,如水平逐行读出、垂直逐列读出、之字型读出和交替读出等,其中之
14、字型读出(ZigZag) 是最常用的一种。由于经 DCT 变换以后,系数大多数集中在左上角,即低频分量区,因此之字型读出实际上是按二维频率的高低顺序读出系数的,这样一来就为游程长度编码(Runleng th Encoding)创造了条件。所谓游程长度编码是指一个码可同时表示码的值和前面几个零,这样就可以把之字型读出的优点显示出来了。因为之字型读出在大多数情况下出现连零的机 课程设计说明书 第 7 页会比较多,尤其在最后,如果都是零,在读到最后一个数后只要给出“块结束”(EOB)码,就可以结束输出,因此节省了很多码率。游程长度指的是由字构成的数据流中各个字符连续重复出现而形成字符串的长度。基本的
15、游程编码就是在数据流中直接用三个字符来给出上述三种信息,其数据结构如图 2.4 所示。图 2.4 基本游程长度编码数据结构CS 表示有一个字符串在此位置,X 代表构成串的字符,SC 代表串的长度。游程编码和哈夫曼编码等属于统计编码。2.5 霍夫曼编码霍夫曼编码是可变字长编码(VLC)的一种。Huffman 于 1952 年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,一般就叫作 Huffman 编码。下面引证一个定理,该定理保证了按字符出现概率分配码长,可使平均码长最短。定理:在变字长编码中,如果码字长度严格按照对应符号出现的概率大小逆序排列
16、,则其平均码字长度为最小。现在通过一个实例来说明上述定理的实现过程。设将信源符号按出现的概率大小顺序排列为 :给概率最小的两个符号 a6 与 a7 分别指定为“1”与“0”,然后将它们的概率相加再与原来的 a1a5 组合并重新排序成新的原为:课程设计说明书 第 8 页对 a5 与 a6分别指定“1”与“0”后,再作概率相加并重新按概率排序得 U:(0.26 0.20 0.19 0.18 0.17)直到最后得 U:(0.61 0.39)分别给以“0”,“1”为止,如图 2.5 所示。霍夫曼编码的具体方法:先按出现的概率大小排队,把两个最小的概率相加,作为新的概率 和剩余的概率重新排队,再把最小的
17、两个概率相加,再重新排队,直到最后变成 1。每次相 加时都将“0”和“1”赋与相加的两个概率,读出时由该符号开始一直走到最后的“1”, 将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的霍夫曼编码。 图 2.5 霍夫曼编码过程例如 2.5 所示 a7 从左至右,由 U 至 U,其码字为 0000;a6 按践线将所遇到的“0”和“1”按最低位到最高位的顺序排好,其码字为 0001用霍夫曼编码所得的平均比特率为: 码长出现概率;上例为:0.22+0.192+0.183+0.173+0.153+0.14+0.014=2.72 bit;可以算出本例的信源熵为 2.61bit,二者已经是很接近了。2.6 运动估计的运动补偿编码这是一种帧间编码的方法,其原理是利用帧间的空间相关性,减小空间冗余度。帧间编码为什么可以减小冗余度,这是因为两帧之间有很大的相似性。如果将前后两帧相减 (移动物体作相应位移)得到的误差作编码所需比特要比帧