相关文章:
校验码——码距 https://blog.csdn.net/weixin_44330072/article/details/106860286
校验码——奇偶校验码 https://blog.csdn.net/weixin_44330072/article/details/106859838
校验码——CRC循环冗余校验码 https://blog.csdn.net/weixin_44330072/article/details/106859961
其实校验码就是在码距的原理上产生的,码距越大校验能力,纠错能力越强,所以奇偶校验码、海明码、CRC码究其原理都是利用一系列规则提升一段码字的码距而已。
一、海明校验 (Hamming Code)
我们在前面指出过要能纠正信息字中的单个错误,所需的最小距离为3。实现这种纠正的方法之一是海明码。
海明码是一种多重(复式)奇偶检错系统。它将信息用逻辑形式编码,以便能够检错和纠错。用在海明码中的全部传输码字是由原来的信息和附加的奇偶校验位组成的。每一个这种奇偶位被编在传输码字的特定位置上。实现得合适时,这个系统对于错误的数位无论是原有信息位中的,还是附加校验位中的都能把它分离出来。
推导并使用长度为m位的码字的海明码,所需步骤如下:
1、确定最小的校验位数k,将它们记成、、…、,每个校验位符合不同的奇偶测试规定。
2、原有信息和k个校验位一起编成长为m+k位的新码字。选择k校验位(0或1)以满足必要的奇偶条件。
3、对所接收的信息作所需的k个奇偶检查。
4、如果所有的奇偶检查结果均为正确的,则认为信息无错误。
如果发现有一个或多个错了,则错误的位由这些检查的结果来唯一地确定。
校验位数的位数:
推求海明码时的一项基本考虑是确定所需最少的校验位数k。考虑长度为m位的信息,若附加了k 个校验位,则所发送的总长度为m+k。在接收器中要进行k个奇偶检查,每个检查结果或是真或是伪。这个奇偶检查的结果可以表示成一个k位的二进字,它可以确定最多2k种不同状态。这些状态中必有一个其所有奇偶测试试都是真的,它便是判定信息正确的条件。于是剩下的(2k-1)种状态,可以用来判定误码的位置。于是导出下一关系:
码字格式:
从理论上讲,校验位可放在任何位置,但习惯上校验位被安排在1、2、4、8、…的位置上。
图5列出了m=4,k=3时,信息位和校验位的分布情况。
码字位置
校验位 x x x
信息位 x x x x
复合码字
图5 海明码中校验位和信息位的定位
校验位的确定:
k个校验位是通过对m+k位复合码字进行奇偶校验而确定的。
其中: 位负责校验海明码的第1、3、5、7、…(、、、、…)位,(包括 自己)
负责校验海明码的第2、3、6、7、…(、、、、…)位,(包括 自己)
负责校验海明码的第4、5、6、7、…(、、、、…)位,(包括 自己)
对m=4,k=3,偶校验的例子,只要进行三次偶性测试。这些测试(以A、B、C表示)在图6所示各位的位置上进行。
海明码 | 码位类型 | 海明码下标 | 校验位组 |
1 | |||
2 | |||
3=1+2 | , | ||
4 | |||
5=1+4 | , | ||
6=2+4 | , | ||
7=1+2+4 | ,, |
图6 奇偶校验位置
因此可得到三个校验方程及确定校验位的三个公式:
公式 = ⊕ ⊕ ⊕ = 0 得 = ⊕ ⊕
公式 = ⊕ ⊕ ⊕ = 0 得 = ⊕ ⊕
公式 = ⊕ ⊕ ⊕ = 0 得 = ⊕ ⊕
若四位信息码为1001,利用这三个公式可求得三个校验位P1、P2、P3值。和海明码,如图7则表示了信息码为1001时的海明码编码的全部情况。而图8中则列出了全部16种信息(D1D2D3D4=0000~1111)的海明码。
海明码 | 码位类型 | 信息码 | 校验位 | 编码后的海明码 |
0 | 0 | |||
0 | 0 | |||
1 | 1 | |||
1 | 1 | |||
0 | 0 | |||
0 | 0 | |||
1 | 1 |
图7 四位信息码的海明编码
0 | 0 | 0 | 0 | 0 | 0 | 0 |
1 | 1 | 0 |
1 |
0 | 0 | 1 |
0 | 1 | 0 | 1 | 0 | 1 | 0 |
1 | 0 | 0 | 0 | 0 | 1 | 1 |
1 | 0 | 0 | 1 | 1 | 0 | 0 |
0 | 1 | 0 | 0 | 1 | 0 | 1 |
1 | 1 | 0 | 0 | 1 | 1 | 0 |
0 | 0 | 0 | 1 | 1 | 1 | 1 |
1 | 1 | 1 | 0 | 0 | 0 | 0 |
0 | 0 | 1 | 1 | 0 | 0 | 1 |
1 | 0 | 1 | 1 | 0 | 1 | 0 |
0 | 1 | 1 | 0 | 0 | 1 | 1 |
0 | 1 | 1 | 1 | 1 | 0 | 0 |
1 | 0 | 1 | 0 | 1 | 0 | 1 |
0 | 0 | 1 | 0 | 1 | 1 | 0 |
1 | 1 | 1 | 1 | 1 | 1 | 1 |
图8 未编码信息的海明码
上面是发送方的处理。
在接收方,也可根据这三个校验方程对接收到的信息进行同样的奇偶测试:
= ⊕ ⊕ ⊕ = 0
= ⊕ ⊕ ⊕ = 0
= ⊕ ⊕ ⊕ = 0
若三个校验方程都成立,即方程式右边都等于0,则说明没有错。若不成立即方程式右边不等于 0,说明有错。从三个方程式右边的值,可以判断哪一位出错。例如,如果第3位数字反了,则C=0(此方程没有B3),A=B=1(这两个方程有B3)。可构成二进数CBA,以A为最低有效位,则错误位置就可简单地用二进数CBA=011指出。
同样,若三个方程式右边的值为001,说明第1位出错。若三个方程式右边的值为100,说明第4位出错。
海明码的码距应该是3,所以能纠正1位出错。而奇偶校验码的码距才是2,只能发现1位出错,但不能纠正(不知道那一位错)。无校验的码距是1,它出任何一位出错后还是合法代码,所以也就无法发现出错。
这是关于海明码的经典说法,即码距为3,可以发现2位,或者纠正1位错。应满足2k-1≥m+k。
但在清华的王爱英主编的《计算机组成与结构》(该书已成为国内的权威)中还提出了一种码距为4的海明码,可以发现2位,并且纠正1位错。应满足2(k-1)≥m+k。
由于王爱英书上对这两种概念没有很仔细解释(特别对码距为3的海明码),过渡很突然。有些书简单抄袭时没有仔细消化,所以出现一些概念错。对于一般码距为3的海明码,应该是“可以发现2位,或者纠正1位错”,而不是“可以发现2位,并且纠正1位错”。在试题中出现过类似的错误。