1、4.1.4 纠错编码的基本原理1、 基本概念 为了方便对差错编码原理进行叙述,下面先介绍一些基本术语。 信息码元 指进行差错编码前送入的原始信息编码。 监督码元 指经过差错编码后在信息码元基础上增加的冗余码元。 码字(组) 由信息码元和监督码元组成的,具有一定长度的编码组合。 码集 不同信息码元经差错编码后形成的多个码字组成的集合。 码重 码字的重量,即一个码字中 “1”码的个数。通常用 W表示。 例如:码字 10011000的 码重 W=3, 而码字 00000000的码重 W=0。 同理: 1001111001, 1100110111 码距 所谓码元距离就是两个码组中对应码位上码元不同的个
2、数(也称汉明距)。码距反映的是码组之间的差异程度,比如, 00和 01两组码的码距为 1; 011和 100的码距为 3。 11000 与 10011之间的距离 d=3。 码字10011001和 11110101之间的码距为 4。 最小码距 码集中所有码字之间码距的最小值即称为最小码距,用 表示。 例如:若码集包含的码字有 10010, 00011,和 11000,则各码字两两之间的码距分别如下: 10010和 00011之间 10010和 11000之间 00011和 11000之间 因此该码集的最小码距为 2,即 。000、 001、 110三个码组相比较,码距有 1和 2两个值最小码距是
3、码的一个重要参数, 它是衡量码检错、纠 错能力的依据。 2. 分组码 分组码一般可用 (n,k)表示。其中, k是每组二进制信息码元的数目, n是编码码组的码元总位数,又称为码组长度,简称码长。 n-k=r为每个码组中的监督码元数目。简单地说,分组码是对每段 k位长的信息组以一定的规则增加 r个监督元, 组成长为 n的码字。在二进制情况下,共有 2k个不同的信息组,相应地可得到 2k个不同的码字,称为许用码 组。其余 2n-2k个码字未被选用,称为禁用码组。( 7, 4) ( 9, 5) k rn3、编码纠检错能力与最小码距之间的关系 数字通信系统中送入信道的信息都是 “ 0”“ 1” 组合的
4、数字信号,例如:待传送的信息是 “ 晴 ” 和 “ 雨 ” ,则只需一位数字编码就可以表示。若用 “ 1” 表示 “ 晴 ” , “ 0” 表示 “雨 ” 。当 “ 0”“ 1” 形式的信息在信道中传输时将 0错成 1或将 1错成 0时,由于发生差错后的信息编码状态是发送端可能出现的状态,因此接收端无法发现差错。 但是如果发送信息送进信道之前,在每个编码之后附加一位冗余码,变成用两位编码 “ 11“ 表示 ” 晴“ , “ 00” 表示 “ 雨 ” ,则在传输过程中由于干扰造成信息编码中一位码发生差错,错成 “ 10” (或“ 01” )时,由于 “ 10” 或 “ 01” 都是发送端不可能出
5、现的编码,接收端就能发现差错,但此时并不能判断出差错是第一比特还是第二比特,因此不能自动纠错 许用码组 00 11 禁用码组 10 01 若继续增加冗余码位数,用 “111”表示 “晴 ”, “000”表示 “雨 ”,当编码在传输中出现 1位或 2位码差错(如错成 001或 101等编码)时,接收端都能检测到,并能确定只有 1位码差错时错误码位的位置,此时这种编码方式可以检测 1位或 2位差错,并能纠正单个的误码。 许用码组: 000, 111 禁用码组: 001 010 011 100 101 110 由上例的分析可见,冗余码位数增加后,编码的抗干扰能力增强。这主要是因为冗余码位数增加后,发送端使用的码集中,码字之间最小码距 增大。由于 反映了码集中每两个码字之间的差别程度,如果 越大,从一个编码错成另一个编码的可能性越小,则其检错、纠错能力也就越强。因此最小码距是衡量差错控制编码纠、检错能力大小的标志。一般情况下,差错编码的纠错能力及检错能力与最小码距之间的关系如下:4. 检错和纠错能力码的最小距离 d0直接关系着码的检错和纠错能力;任一 (n,k)分组码,若要在码字内 :(1) 检测 e个随机错误,则要求码的最小距离 d0e+1;A 0 1 2 3 BA 0 1 2 3e B