1、1多声道数字音频系统的编码及应用Multi-channel Audio Coding and Its Applications胡 泽(北京广播学院录音艺术学院)摘要随着存储媒体容量和传输带宽的不断提高,高质量多声道数字音频系统也逐渐取代传统的单声道、立体声系统,而成为新的传播媒体方式。本文着重介绍当前几种典型的多声道数字音频系统的编、解码技术。以 MPEG-2、AC-3 、DTS、MPEG AAC 多声道数字音频系统来讨论它们各自声道的配置、数据容量、数据率等所带来的优缺点,最后介绍在数字音视频广播中,多声道数字音频系统的应用。1、前言对于 CD 格式来说,大家都知道它具有良好的信噪比、超过
2、80dB 以上的动态范围以及超过 15kHz 的频率范围,这使得它具有良好的音频质量和满意的收听效果,但是它仅仅提供了两个声道。多声道数字音频系统通过声道的扩展,不仅在质量上与 CD 音频不相上下,同时还带给听众身临其境的感受,而这是传统单声道和立体声无法实现的,因此多声道数字音频系统已被更多的听众接受,同时也逐渐成为音乐制作的主流。在众多的国际标准中,如 SMPTE、EBU、ITU-R、ISO/IEC、MPEG 等,都涵盖着一种称之为 5.1 声道的多声道数字音频格式。在即将制定的 DVD-Audio 标准中,也规定将采用 24bit 采样精度、88.2,96,192KHz 采样率的多声道数
3、字音频格式。一种广泛接受的多声道数字音频系统配置方案就是我们常称的 5.1 声道系统,也就是3/2/.1 的配置方案。这种方法是按照 ITR-U 的建议 BS.775 来确定用于重放的扬声器摆放位置的,如图 1 所示。根据建议可知,5 个全频带的重放扬声器分为前置扬声器(包括 L、R、C )和后置扬声器(也称环绕扬声器,包括 Ls、Rs) ,按照图示所规定的角度和方位进行摆放,并且它们都位于一个圆的边界上,其中 L、R 扬声器与 C 扬声器分别呈 30 度夹角,Ls、Rs 扬声器与 C 扬声器分别呈 110 度夹角。除此 5 个全频带的声道外,还有一个低频增强声道,称之为 LFE,它的频率范围
4、在 200Hz 以下,大约是全频带倍频程的 10%左右,因此也称点一声道。它的放置没有特殊的要求,一般放置在前面。5 个重放扬声器的摆放并不是说能够完全重现真实的空间声像,其实 5 个扬声器的使用仅仅是一种重现空间声像而采用的粗略的实现方式。当然,一方面重放的效果取决于音频素材的制作,另一方面则需要严格的重放扬声器的空间位置摆放和收听者的位置关系。在电影院里我们往往能够感受到声像定位准确的音频效果,现在也有一些提法,认为 8 个、10 个、12 个甚至更多的重放扬声器会有更加完美的音频效果。这些观点有它存在的理由,声像的表现当然是越准确越好,但是一味的通过增加重放扬声器的数量以及增加音频声道数
5、的话,它也会带来另外的负面影响,如声像的定位更加困难等等,因此我们在此仅仅通过 5.1 声道的实现方式来进行阐述。另外,我们还应明确一点,对于家庭消费者来说,5.1声道已经足够表现较完美的音频效果了。不管是那种摆放方式,它的实现都离不开基本的编码方式和主要规则。另外 5.1 声道方式还会带来较大的压缩比和较低的比特率(相对于更多声道的情况) ,下面就详细的来介绍一下多声道数字音频系统的编码方式。2图 1 ITR-U 的建议 BS.775 确定的用于重放的扬声器摆放位置2、多声道数字音频的编码从立体声向多声道的过渡,增加了对存储和传输媒体的需要。下面以 CD 格式为例,假设它的采样频率为 Fs=
6、44.1kHz,采样精度 R 为 16bit,那么 CD 格式的音频数据率 B 为:BCD=2RFs=1.411Mb/s由此可知,一个小时的 CD 格式的音乐需要 635MB 的存贮空间,其实 CD 最长的重放时间为74 分钟。那么如果使用的是多声道时,此时的数据率为:Bcdmultichannel=5.1RFs=3.598Mb/s同样一个小时的多声道格式的音乐需要 1.62GB 的存储空间,远远大于 CD 的容量。同时当前已应用的多声道系统面临着带宽的问题。如美国的数字电视中仅仅给多声道的音频384kb/s 的带宽,在 Internet 音频广播中,也只有 56kb/s 的数据通道,因此由上
7、可知,多声道数字音频系统面临者存储容量和传输带宽的限制。如何将多声道数字音频数据率降低的同时又能够保证音频质量,是多声道数字音频系统面临的重大问题。众所周知,对于线性 PCM 来说,它的实现简单,在高容量/高带宽的前提下可以提供 CD 质量的音频信号。从另一个角度来看,采样精度的提高以及采样频率的提高,会带来更高的音频质量,如将采样精度由 R=16 提高到 R=24;将采样频率由Fs=44.1kHz 或 Fs=48kHz 提高到 Fs=96kHz 或 Fs=192kHz。这种发展趋势已经逐渐地由一些录音工程师和音乐制作商所接受,同样多声道数字音频系统则也要顺应这种趋势。但如果仍然采用线性 PC
8、M,这无疑是增加了更大的数据量,提高了现有的数据率。我们知道线性 PCM 并没有充分利用音频信号的特性进行编码,在 PCM 数据流中存在着大量的冗余信息。同时要强调的是不管音频信号如何编解码、传输,最终还是要靠我们的人耳来实现的,如图 2 所示,因此我们可以充分地考虑人耳的听觉特性,并加以利用,如人耳的掩蔽效应、哈斯效应等等。这样就可以将音频信号中与人耳有关的那部分冗余信息3去除掉,在编码时则仅仅对有用的那部分音频信号进行编码,从而降低了参与编码的数据量。同时再将编码的信号进行比特精度的分配,对于幅度比较大的信号或变化比较快的信号分配更多的比特数,而对于幅度小、变化慢的信号则减少比特数的分配,
9、从而达到减少数据率的可能性,实现编码的高效率。当然这种结果是以编码过程复杂化为代价的。下面具体分析几种声学模型。图 2 编码、传输、人耳听音的实现21 根据听觉域度对可闻信号进行编码人耳对声振动的感受,在频率及声压级方面都有一定的范围,频率范围正常人约为20Hz20kHz,而声压级范围则是如图听阈曲线来描述的。意即在这条曲线之下的对应频率的信号是听不到的。声压级A 听阈曲线 B频率 f图 3 听觉域度对编码的作用如图 3 所示,对于信号 A 来说,由于其声压级超过听阈曲线的声压级域值,所以可以对人耳造成声振动的感受,意即听到 A 信号。而对 B 信号来说,其声压级位于听阈曲线之下,虽然它是客观
10、存在的,但人耳是不可闻的。因此,可以将类似的信号去除掉,以减少音频数据率。2 2 根据掩蔽效应,只对幅度强的掩蔽信号进行编码人耳能在寂静的环境中分辨出轻微的声音,但在嘈杂的环境中,同样的这些声音则被嘈杂声淹没而听不到了。这种由于一个声音的存在而使另一个声音要提高声压级才能被听到的现象称为听觉掩蔽效应。声压级 A后向掩蔽 前向掩蔽BC频率 f图 4 听觉掩蔽效应如图 4 所示,虽然 B、C 两信号的声压级已超过听阈曲线的范围,人耳已可以听到B、C 两信号的存在,但是由于 A 信号的存在,通过前向掩蔽将 C 信号淹没掉,通过后向编码 解码4掩蔽将 B 信号淹没掉,从而最终到达人耳引起感觉的只有 A
11、 信号。因此,可以将类似的B、C 信号去除掉以减少音频数据率。2 3 量化噪声使得不必全部编码原始信号类似于人耳的听阈曲线,由于数字信号存在着量化噪声,如图 5 所示,对于信号 A和 B 来说,并不一定要将 A、B 信号进行全部幅度的编码,而只需将 A、B 信号与量化噪声的差值进行编码就可以达到相同的听觉效果,因此,在编码过程中实际量化幅度就可以大大的减少,而减少数据率。声压级 AB 量化噪声频率 f图 5 量化噪声对编码的影响2 4 通过子带分割来进行优化、编码在传统的编码过程中,都是将整个频带作为操作对象,采用相同的比特分配对每个信号进行量化。而实际上,由于听觉曲线的存在及其它因素,对于幅
12、度较小的信号可以分配较少的比特数就可以达到要求,因此将整个频带分成多个子频带,然后对每个子频带的信号独立编码,从而使得在每个子频带中比特分配可以根据信号自身来适应。声压级子频带AD C B频率 f图 6 子带编码、优化如图 ABCD 四个信号,如果对整个频带编码,对于 D 信号来说分配 16 比特来量化则显得多余浪费,所以如果将 ABCD 分别置于不同的子带内,则可在分别所处的子带内使用最适合的比特数分配给信号来编码,从而减少数据率,同时如果用于分割的子带分辨率越高,意即子带的频带相对越窄,那么在子带中分配的比特数就越精确,而减少了比特率。2. 5 不同的实现方式当前在数字音频编码领域存在着各
13、种不同的编码方案和实现方式,为了能够让大家对此有一个较完整的认识,在本文中仅对当前流行的几种典型的编码方法做一个介绍。不管是通过那一种方式实现,其基本的编码思路方框图都大同小异,如图 7 所示。对于每一个音频声道中的 PCM 音频信号来说,首先都要将它们映射到频域中,这种时域到频域的映射可以通过子带滤波器(如 MPEG Layers I,II,DTS)或通过变换滤波器组(如 AC-3,MPEG AAC)实现。这两种方式的最大不同之处在于滤波器组中的频率分辨率的不同。5图 7 多声道数字音频系统基本的编码方框图每个声道中的音频采样块首先要根据心理声学模型来计算掩蔽门限值,然后由计算出的掩蔽门限值
14、来决定如何将公用比特区中的比特分配给不同的频率范围内的信号,如 MPEG Layers I,II ,DTS 所采用;或由计算出的掩蔽门限值来决定哪些频率范围内的量化噪声可以引入而不需要去除,如 AC-3,MPEG AAC 所采用。然后根据音频信号的时域表达式进行量化,随后采用静噪编码(如 MPEG Layers I,II,DTS,MPEG AAC) 。最后,将控制参数及辅助数据进行交织产生编码后的数据流。解码过程则首先将编码后的数据流进行解复用,然后通过比特流中传输的控制参数对音频数据反量化,或通过心理声学模型参数反向运算得到音频信号(如 AC-3) ,最后将得到的音频信号由频域反变换到时域,
15、完成解码过程。另外多声道数字音频编码技术还充分利用了声道之间的相关性及双耳听觉效应,来进一步去除声道之间的冗余度和不相关度。去除通道之间的相关度,一种最常用的方法是M/S 方式,在这种方式中是将两个独立声道的频谱相加和相减,根据两个声道的相关度大小,来决定是传输和/差信号还是传输原始信号。由于人耳对于频率超过 2-3kHz 的声音定位主要是通过内耳密度差分(IID )实现的,因此为了进一步减少数据率,将各个声道中频率超过约定门限值的信号组合后再进行传输。这种技术应用在 MPEG Layers I,II ,III 中,实现强度立体声编码;用在 AC-3 中对两个声道或耦合声道实现多声道编码。在
16、MPEG AAC 中,则既可实现强度立体声编码,又可实现多声道编码。3、杜比数字 AC-3 编解码压缩过程AC-3 最早是在 1991 年的电影 “Batman Returns”中应用的。它的应用不仅在电影界占有一席之地,而且它已被北美地区的数字电视及 DVD 视频定为其数字音频实施规范。我们熟知的 AC-2,AC-3 都是由两声道发展而来的,即杜比数字( Dolby Digital) 。对于数字音频信号来说,通过应用数字压缩算法,来减少正确再现原始脉冲编码调制(PCM )样本所需要的数字信息量,得出原始信号经数字压缩后的表达式。 3. 1 AC-3 编码过程AC-3 编码器接受 PCM 音频
17、并产生相应的 AC-3 数码流。在编码时,AC-3 算法通过对音频信号的频域表达式进行粗量化,达到高的编码增益(输入码率对输出码率之比) 。如图 8 所示。编码过程的第一步是把音频表达式从一个 PCM 时间样本的序列变换为一个频率系数样本块的序列。这在分析滤波器中完成。512 个时间样本的相互重叠样本块被乘以时间窗而变换到频域。由于相互重叠的样本块,每个 PCM 输入样本将表达在两个相继的变换样本块中。频域表达式则可以二取一,使每个样本块包含 256 个频率系数。这些单独的频率系数用二进制指数记数法表达为一个二进制指数和一个尾数。这个指数的集合被编码为信号频谱的粗略表达式,称作频谱包络。核心的
18、比特指派例行程序用这个频谱包络,确定每个单独尾数需要用多少比特进行编码。将频谱包络和 6 个音频样本块粗略量化的尾数,格式化成一个 AC-3 数据帧(FRAME) 。AC-3 数码流是一个 AC-3 数据帧的序列。时域到频域映射滤波器组比特/噪声分配,量化及编码比特流格式化心理声学模型PCM 音频信号 编码的比特流辅助数据(可选)6图 8 AC-3 编码框图在实际的 AC-3 编码器中,还包括下述功能: 附有一个数据帧的信头(header) ,其中包含与编码的数码流同步及把它解码的信息(比特率、取样率、编码的信道数目等) 。 插入误码检测码字,以便解码器能检验接收的数据帧是否有误码。 可以动态
19、的改变分析滤波器组的频谱分辨率,以便同每个音频样本块的时域/频域特性匹配的更好。 频谱包络可以用可变的时间/频率分辨率进行编码。 可以实行更复杂的比特指派,并修改核心比特分派例行程序的一些参数,以便产生更加优化的比特指派。 一些声道在高频可以耦合在一起,以便工作在较低比特率时,可得到更高的编码增益。 在两声道模式中,可以有选择的实行重新设置矩阵的过程,以便提供附加的编码增益,以及当两信道的信号解码时使用一个矩阵环绕声解码器,还能获得改进的结果。3. 2 AC-3 解码过程解码过程基本上是编码的逆过程。解码器必须同编码数码流同步,检查误码,以及将不同类型的数据(例如编码的频谱包络和量化的尾数)进
20、行解格式化。运行比特指派例行程序,将其结果用于解数据大包(unpack)和尾数的解量化。将频谱包络进行解码而产生各个指数。各个指数和尾数被变换回到时域成为解码的 PCM 时间样本。如图 9 所示:图 9 AC-3 解码过程框图编码的频谱包络PCM样本分析滤波器组指数频谱包络编码尾数尾数量化比特指派比特指派信息AC-3 数据帧的格式化量化的尾数编码的AC-3 音频数码流尾数解码的频谱包络编码的AC-3 音频数据流AC-3 数据帧同步、误码检测和数据帧的解格式化过程比特指派比特指派的信息尾数的解量化量化的尾数频谱包络的解码过程综合滤波器组指数 PCM样本7在实际的 AC-3 解码器中,还包括下述功
21、能: 假若检测出一个数据误码,可以使用误码掩盖或静噪。 高频内容耦合在一起的那些声道必须去除耦合。 无论何时已被重新设置矩阵的声道,必须进行去除矩阵化的过程(在 2-声道模式中) 。 必须动态的改变综合滤波器组的分辨率,与编码器分析滤波器组在编码过程中所用的方法相同。3. 3 杜比数字 AC-3 编码数据格式经过杜比数字 AC-3 编码器的编码处理,可以将原始的数据 PCM 信号编码为杜比数字 AC-3 音频数据流。一个 AC-3 串行编码的音频数据流是由一个同步帧的序列所组成。如图 10 所示。图 10 AC-3 同步帧结构由图可见,每个同步帧包含六个编码的音频样本块(AB)其中每个代表 2
22、56 个新的音频样本。在每个同步帧开始的同步信息(SI)的信头中,包含为了获得同步和维持同步所需要的信息。接着 SI 后面的是数码流信息(BSI)的信头;它包含描述编码数据流业务的各种参数。编码的音频样本块之后接着是一个辅助数据(AUX)字段。在每个同步帧结尾处是误码检验字段,其中包含一个用于误码检测的 CRC 字。一个附加的 CRC 字位于 SI 信头中,以供选用。AB0AB5 的每一块代表一个编码通道,可以被分别独立解码,块的大小可以调整,但总数据量不变。在图中还有两个未标出的 CRC,其中第一个位于帧的 5/8 处,另一个位于帧未。之所以如此安排,目的就是可以减少解码器的 RAM 需求量
23、,使得解码器不必完全接收一帧后才解码音频数据,而是分成了两部分进行解码。3. 4 杜比数字 AC-3 的兼容性由于 AC-3 比特流中同步结构中的 AB0AB5 是独立解码的,因此可以将这些编码信号重新构造为所需的输出信号,即输出的下行兼容性。如图 11 所示。SI BSI AB0 AB1 AB2 AB3 AB4 AB5 AB6 AUX CRC杜比数字编码器AC-3 数据流分配杜比 AC-35.1 解码器Lt/Rt矩阵混合立体声混合单声道混合LCRLsRsLFEPROLOGICLCRSHI FI VCRLR单声道信号8图 11 AC-3 输出的下行兼容性在许多重放系统中,扬声器的数目不能同编码
24、的音频声道的数目匹配。为了重现完整的音频节目需要向下混合。在帧同步中,AB0AB5 中记录着六个独立声道的音频数据,按照 AC-3 重放时的安排,我们称之为 L、R、C、Ls、Rs 、LFE 。一般用于向下混合的过程中,低音增强 LFE 通道记录的音频信号主要用于渲染烘托气氛,所以向下混合时,只用其中的 L、R、C、Ls、Rs 。从图中可以看到编码后的 AC-3 数据流可以直接传输后经解码器解码为 5.1 通道音频信息进行重放,也可以向下混合为两个声道信号,然后经不同的解码器得到不同的重放模式。就单一环绕声道(n/1 模式)而言,把 S 称为单个环绕声道。从图中可看出,向下混合提供两种类型:向
25、下混合为 Lt、Rt 矩阵环绕编码的立体声对;向下混合为通常的立体声信号 Lo、Ro。向下混合的立体声信号(Lo、Ro 或 Lt、Rt)可进一步向下混合为单声道 M,通过两个声道简单的相加即可。如果将 Lt、Rt 向下混合为单声道,环绕信息将会丢失。当希望需要一个单声道信号时则 Lo、Ro 向下混合更可取。用于 Lo、Ro 立体声信号的一般 3/2 向下混合方程式为:Lo=1.0L+clevC+slevLs;Ro=1.0R+clevC+slevRs;如果接着 Lo、Ro 被组合成单声道信号重放,有效的向下混合方程式为:M=1.0L+2.0clevC+1.0R+slevLs+slevRs;如果只
26、出现单个环绕声道 S(3/1 模式) ,则向下混合方程式为:Lo=1.0L+clevC+0.7slevS;Ro=1.0R+clevC+0.7slevS;M=1.0L+2.0clevC+1.0R+1.4slevS;其中 clev、slev 分别代表中央声道混合声级系数和环绕声道混合声级系数,在 BSI 数据中由 Cmixlev、Surmixlev 比特字段来指出相对应的值。用于 Lt、Rt 立体声信号的一般 3/2 向下混合方程式为:Lt=1.0L+0.707C-0.707Ls-0.707Rs;Rt=1.0R+0.707C+0.707Ls+0.707Rs;如果只出现单个环绕声道 S(3/1 模式
27、) ,则向下混合方程式为:Lt=1.0L+0.707C-0.707S;Rt=1.0R+0.707C+0.707S;经过对独立声道的音频信号进行不同的分配及矩阵重组,则实现了 AC-3 数据流的向下兼容性,意即通过不同的解码器、解码矩阵方式,可以得到杜比数字 5.1 声道环绕声、立体声、杜比 Prologic、单声道以及杜比的虚拟环绕声方式。其中 Lo、Ro 与 Lt、Rt 的最大区别就是 Lt、Rt 是记录的全部的 L、R、环绕声的信息,经过矩阵重解可得到环绕声信息,而 Lo、Ro 则是将环绕声信息增加支立体声信号中,无法再重现环绕声信号信息。4、MPEG-2 多声道编解码过程MPEG-2 感
28、知编码系统充分利用了心理声学中的掩蔽效应和哈斯效应,利用压缩编码技术,将原始音频信号中不相关分量和冗余分量有效的去除掉,在不影响人耳听觉阈度和听音效果质量上,将音频信号压缩。41 MPEG 音频子带编码器的基本结构感知型子带音频编码器不断地对音频输入信号进行分析。由一个心理声学模型动态地确定掩蔽门限,即在该掩蔽门限之下的多余的噪声是无法为人的听觉系统听到的。由该心理声学模型产生的信息被馈至一个比特分配模块,该模块的任务是将各声道可用的比特以一种优化的方式在频谱范围内进行分配。输入信号还与上述过程并行地被分割到一系列称9为子带的频带中。每个子带信号都在经过定标处理后被重新进行量化,该量化编码过程
29、引入的量化噪声不能超过已确定的对应子带的掩蔽门限。因此量化噪声频谱就与信号频谱进行了动态自适应。 “比例因子”和各子带所使用的量化器的相关信息与编码后的子带样值一同进行传输。解码器可以在不了解编码器如何确定编码所需信息的情况下对码流进行解码。这可以降低解码器的复杂度,并为编码器的选择和解码器开发提供了很大的灵活性。如在心理声学研究上取得了新的结果,则更高效率和更高性能的编码器可在与所有现有解码器完全兼容的条件下得以应用。这一灵活性目前已有了成功的例子,现在最高技术水平的编码器的性能已超过了标准化过程中使用的早期编码器。如图 12 所示。图 12(a)MPEG 音频编码器框图图 12(b) MP
30、EG 音频解码器框图42 层MPEG 音频标准包括了三种不同的算法,称为层。层数越高,相应可达到的压缩比就越高,而复杂度、延时及对传输误码的敏感度也越高。层 II 专门对广播应用进行了优化。它使用了具有 32 个等宽子带划分的子带滤波,自适应比特分配和块压扩。单声道的码率范围为 32-192 kbps,立体声为 64-384 kbps。它在 256 kbps 及 192 kbps 相关立体声条件下的表现十分出色。128 kbps(立体声)条件下的性能在许多应用中仍可接受。43 MPEG-2 在多声道音频方面的扩展ITU-R 工作组 TG10-1 在关于多声道声音系统的建议方面进行了工作。该项工
31、作的主要成果就是建议 BS.775,其中说明一个适当的多声道声音配置应包含五个声道,分别代表左、中央、右、左环绕、右环绕声道。如果使用了一个作为选项的低频增强声道(LFE) ,则该配置被称为“5.1” 。五声道配置也可表示为3/2 ,即三个前置声道及两个环绕(后置)声道。MPEG 已认识到应根据 ITU-R 建议 775 来增加音频标准的多声道能力的必要性。这是在第二阶段完成的,由此产生了 MPEG-2 音频标准。在多声道声音方面的扩展支持在一路码流中传输五个输入声道、低频增强声道以及 7 个旁白声道。该扩展与 MPEG-1 保持前向及后向兼容。前向兼容性意味着多声道解码器可正确地对立体声码流
32、进行解码。后向兼容性则意味着一个标准的立体声解码器在对多声道码流进行解码时可输出兼容的立体声信号。这是通过一种真正的可分级方式实现的。在编码器端,五个输入声道被向下混合为一路兼容立体声信号。该兼容立体声信号按照 MPEG-1 标准进行编码。所有用于在解码器帧拆包 去量化 反向子带 滤波器编码码流输入LPCM音频输出帧拆包 去量化 反向子带 滤波器编码码流输入音频输出子带滤波器量化器编码器心理声学模型比特分配组帧编码码流输出PCM输入10端恢复原来的五个声道的信息都被置于 MPEG-1 的附加数据区内,该数据区被 MPEG-1 解码器忽略。这些附加的信息在信息声道 T2、T 3 及 T4 以及
33、LFE 声道中传输,这几个信息声道通常包含中央、左环绕和右环绕声道。MPEG-2 多声道解码器不但对码流中的 MPEG-1部分进行解码,还对附加信息声道 T2、T 3、T 4 及 LFE 解码。根据这些信息,它可以恢复原来的 5.1 声道声音。如图 13 所示。图 13 MPEG-2 编码器/ 解码器框图当相同码流馈送至 MPEG-1 解码器时,解码器将只对码流的 MPEG-1 部分进行解码,而忽略所有附加的多声道信息。由此它将输出在 MPEG-2 编码器中经向下混合产生的两个声道。这种方式实现了与现有的双声道解码器的兼容性。也许更为重要的是,这种可分级的方式使得即使在多声道业务中仍可使用低成
34、本的双声道解码器。考虑到所使用的其它所有编码策略,多声道业务中的双声道解码器本质上就是一个对所有声道进行解码并在解码器中产生双声道向下混合信号的多声道解码器。如图 14 所示。就其包含了不同的可由编码器使用以进一步提高音频质量的技术而言,该标准是具有很大灵活性的。44 定向逻辑兼容性如果源素材已经经过环绕声编码(如 Dolby 环绕声) ,广播业者可能希望将它直接播送给听众。一种选择是将该素材直接以 2/0(仅为立体声)模式播送。环绕声编码器主要是将中央声道信号分别与左右声道信号同相相加,而将环绕声道信号分别与左右声道信号反向下混合MPEG-1编码器扩展编码器LOROT2T3T4LFELRCLSRSLFEMPEG-2 编码器重新混合MPEG-1解码器扩展解码器LOROT2T3T4LFELRCLSRSLFEMPEG-2 解码器向下混合MPEG-1编码器扩展编码器LOROT2T3T4LFELRCLSRSLFEMPEG-2 编码器MPEG-1解码器LORO图 14 MPEG-2 编码器-MPEG-1 解码器兼容性