CRC算法原理及其Verilog实现

一．CRC简介

CRC校验是一种在数据通信系统和其它串行传输系统中广泛使用的错误检测手段。通用的CRC标准有CRC-8、CRC-16、CRC-32、CRC-CCIT，其中在网络通信系统中应用最广泛的是CRC-32标准。本文将以CRC-32为例，说明CRC编码的实现方式以及如何用verilog语言对CRC编码进行描述。

二．模2运算

在说明CRC编码方式之前，首先介绍一下模2运算法则，在CRC运算过程中会使用到模2除法运算。模2运算是一种二进制运算法则，与四则运算相同，模2运算也包括模2加、模2减、模2乘、模2除四种运算。模2运算用“+”表示加法运算，用“-”、“×”或“.”、“/”分别表示减法、乘法和除法运算。与普通四则运算法则不同的是，模2加法是不带进位的二进制加法运算，模2减法是不带借位的二进制减法运算。同时，模2乘法在累加中间结果时采用的是模2加法运算；模2除法求商过程中余数减除数采用的是模2减法运算。因此，两个二进制数进行模2加减法运算时，相当于两个二进制数进行按位异或运算，每一位的结果只与两个数的当前位有关。模2除法在确定商时，与普通二进制除法也略有区别。普通二进制除法中，当余数小于除数时，当前位的商为0，当余数大于等于除数时，当前位的商为1。模2除法在确定当前位的商时，只关心余数的首位，首位为1则商为1，首位为0则商为0。

1.模2加法的定义：

0+0=0，0+1=1，1+0=1，1+1=0。

举例如下：

1010+0110=1100。

2.模2减法的定义：

0-0=0，0-1=1，1-0=1，1-1=0。

举例如下：

1010-0110=1100。

3.模2乘法的定义：

0×0=0，0×1=0，1×0=0，1×1=1。

举例如下：

1011×101=100111

列竖式计算：

1011

× 101

——————

1011

0000

1011

——————

100111

其中横线之间的累加过程，采用的是2进制加法，不进位。

4.模2除法：

0/1=0，1/1=1。

举例如下：

1011/101=10，余数为100。

列竖式计算：

————

101 ）1011

101

————

100

三.CRC实现原理

CRC校验的基本思想是：利用线性编码理论，在发送端根据要发送的k位二进制码序列，以一定的规则产生一个校验用的r位监督码（即CRC码），并附在信息码后面，构成一个新的共k+r位的二进制码序列，最后发送出去。在接受端，则根据信息码和CRC码之间所遵行的规则进行校验，以确定传输过程中是否出错，并纠错。一般而言，监督码的位宽r越大，纠错能力就越能，例如，CRC32的纠错能力比CRC16要强。CRC校验获得监督码的方式是，将k位信息码转换成多项式，然后除以一个生成多项式，获得余数即为监督码。

在求解一个k位二进制信息码的CRC之前，首先需要将二进制信息码转换成多项式。一个二进制数序列的各个位是它对应多项式的系数，例如，二进制序列1101对应的多项式为：

M(x)= X³×X²+X⁰

通过这种转换方式获得的多项式称为信息多项式。在进行CRC计算时，除了信息多项式之外，还需要有一个生成多项式G(x)。生成多项式G(x)要求次数大于0，并且要求0次幂的系数为1。根据以上约束，以及对纠错能力的要求，人们提出了一些通用的CRC生成多项式，例如：CRC16和CRC32等。

CRC16的生成多项式为：G(x)= X¹⁵+X¹⁰+X²+1

CRC32的生成多项式为：G(x)= X³²+X²⁶+X²³+X²²+X¹⁶+X¹²+X¹¹+X¹⁰+X⁸+X⁷+X⁵+X⁴+X²+X¹+1

CRC的值等于信息多项式M(x)乘以2ⁿ，再除以生成多项式G(x)所得的余数，除法采用模2除法。其中，n表示的是生成多项式G（x）的最高次幂，CRC16中n为16，CRC32中n为32。

四．CRC-32串行计算公式推导

根据二进制信息码转换成多项式的方法，对于任意一个长度为（m+1）的二进制信息码，可以转换成一个最高次幂为m的多项式：

M(x)= M_m×2^m+ M_m-1×2^m^-1+ … + M₁×2¹+ M₀×2⁰

为求此二进制序列的CRC值，首先将M(x）乘以2³²，然后再除以生成多项式G（x），所得余数即为CRC32的值。G（x）亦为一个二进制多项式。设除法运算获得的商为Q(x),余数为R（x），那么：

M(x)×2³²/ G(x) = M_m×2^m×2³²/ G(x) + M_m-1×2^m^-1×2³²/ G(x) + … + M₁×2¹×2³²/ G(x)+ M₀×2⁰×2³²/ G(x) --------（公式一）

M(x)×2³²/ G(x) = Q(x) + R(x)/ G(x) --------（公式二）

我们从最高位开始解，将M(x)中最高次项的系数M_m作为一个特殊的M(x)即带入公式二：

M_m×2³²/ G(x) = Q_m(x) + R_m(x)/ G(x) --------（公式三）

其中，M_m的值为1，因为最高次项必须为1。R_m(x)是余数，是一个最高次幂为31的多项式。再将公式三代入公式一:

M(x)×2³²/ G(x) = M_m×2^m×2³²/ G(x) + M_m-1×2^m^-1×2³²/ G(x) + … + M₁×2¹×2³²/ G(x)+M₀×2⁰×2³²/ G(x)

={Q_m(x)×2^m + R_m(x)/ G(x)×2^m} + M_m-1×2^m^-1×2³²/G(x)+ … + M₁×2¹×2³²/ G(x) + M₀×2⁰×2³²/ G(x)

= Q_m(x)×2^m + {R_m(x)×2/G(x)×2^m^-1+M_m-1×2^m^-1×2³²/G(x)} + … + M₁×2¹×2³²/ G(x) + M₀×2⁰×2³²/ G(x)

= Q_m(x)×2^m + {(R_m(x)×2 + M_m-1×2³²)/ G(x)}×2^m^-1+ … + M₁×2¹×2³²/ G(x)+ M₀×2⁰×2³²/ G(x)

--------（公式四）

公式四中，设

{(R_m(x)×2 + M_m-1×2³²)/ G(x)}= Q_m-1(x) + R_m-1(x)/ G(x) --------（公式五）

再代入到公式四中，那么公式四转化为,相当于只留下可以整除的Q(x)，而将余数R(x)一层一层拆解：

M(x)×2³²/ G(x)= Q_m(x)×2^m+Q_m-1(x)×2^m^-1+{(R_m-1(x)×2 + M_m-2×2³²)/G(x)}×2^m^-2+ …+M₁×2¹×2³²/G(x)+M₀×2⁰×2³²/G(x)

以此类推，最终获得公式：

M(x)×2³²/G(x)=Q_m(x)×2^m+Q_m-1(x)×2^m^-1+Q_m-2(x)×2^m^-2+…+Q₁(x)×2¹+Q₀(x)+R₀(x)/G(x) --------(公式六)

根据CRC的定义，多项式R₀(x)对应的系数即为我们的CRC32的值。

以上推导过程表明：一个m+1位的二进制序列，可以按位求取CRC32的值。运算时，首先从最高位(第m+1位，设最右边的为第1位)开始计算，然后依次计算较低位。当输入第n个位(n<m+1)时，首先将第n+1位运算后的结果乘以2，再将第n的值(0或1)乘以2³²，两者相加后除以生成多项式G(x)。因此，每一位的CRC32运算就转化成了一个最高次幂为32的多项式除以一个最高次幂为32的多项式（生成多项式），结果（余数）为一个最高次幂不超过31的多项式。

五．CRC32串行计算的LFSR实现

上一节已经推导出了CRC的串行实现方法，但如何将公式六用Verilog语言表示出来呢？用Verilog描述CRC32的串行计算方法时，使用到了一种叫做LFSR（Linear feedback shift register）的结构。下图为该LFSR的结构图，其中寄存器3到寄存器25没有在图中画出。

CRC算法原理及其Verilog实现 - Lucien - 技术无极-创意无限

图1.CRC32的串行移位寄存器实现

如图所示，各个寄存器储存着上一次CRC32运算的结果，寄存器的输出即为CRC32的值。让我们回顾一下CRC32的生成多项式：

G(x)= 2³²+2²⁶+2²³+ 2²²+2¹⁶+2¹²+2¹¹+2¹⁰+2⁸+2⁷+2⁵+2⁴+2²+2¹+1

当输入新的位参与运算时，信息多项式为：

M(x)= M_n×2³²

上一次CRC计算的结果为：

R_n+1(x) = A₃₁×2³¹+ A₃₀×2³⁰+ A₂₉×2²⁹+ … + A₂×2²+ A₁×2¹+ A₀×1

根据上一节推导出的公式，新的CRC32值R_n(x)为{R_n+1(x)×2 + M(x)}/ G(x)的余数。设

Q(x) = R_n+1(x)×2 + M(x),则：

Q(x) =（A₃₁+M_n）×2³²+ A₃₀×2³¹+ A₂₉×2³⁰+ … +A₁×2²+ A₀×2¹

在计算Q(x)/G(x)的结果时，根据模2运算法则，如果A₃₁+ M_n的结果为1，则商为1，余数为Q(x)-G(x)；如果A₃₁+ M_n的结果为0，则商为0，余数为Q(x)本身。其中，A₃₁+ M_n是模2加法，不进位；Q(x)-G(x)模2减法，不借位。

当上一个CRC32结果的最高位A₃₁和输入的数值M_n模2加法结果为1时，上一次CRC结果右移一位，完成乘2的过程，再与G(x)多项式的系数进行异或运算，完成减法。由于任何数与0异或保持不变，所以LFSR中只有在G(x)多项式为1的系数处才放置异或门。运算完毕以后把结果存入寄存器即为新的CRC32值。

当上一个CRC32结果的最高位A₃₁和输入的数值M_n模2加法结果为0时，Q(x)不够除，Q(x)本身作为余数存入寄存器，获得新的CRC32值。由于A₃₁+ M_n的结果为0，异或门不起作用，Q(x) = A₃₀×2³¹+ A₂₉×2³⁰+ … +A₁×2²+ A₀×2¹，由R_n+1(x)右移一位获得, Q(x)的0次幂为0，刚好把A₃₁+ M_n的结果作为输入。

六．CRC32串行计算的Verilog实现

根据第五节中的描述，一位数据的CRC32值为：

crc32_new = {crc32_old[30:0],1'b0} ^ ({32{(crc32_old[31] ^ datain)}} & POLYNOMIAL) ;

其中，crc32_old为之前存储在LFSR中的值，可以是上一次计算的结果，也可以中第一次计算时的初始值。datain表示的是新参与运算的一位数值。POLYNOMIAL是生成多项式的系数对应的二进制序列，POLYNOMIAL=32'h04C11DB7,是个常数。上述Verilog语句中，如果crc32_old[31]^datain为0，则crc32_new由crc32_old左移一位（即乘以2）后获得；如果crc32_old[31]^datain为1，在POLYNOMIAL为1的位上，{crc32_old[30:0],1'b0}与1相异或获得新的CRC32值crc32_new。此语句实现的逻辑，刚好满足CRC32的定义，是对第五节中提及的LFSR行为的描述。

求一个二进制序列的CRC32值时，可以让二进制序列的各个位依次计算CRC32，最终的结果即为二进制序列的CRC32值。例如一个长度为8的二进制序列，它的CRC32值为：

function [`CRC_WIDTH-1:0] crc_data1;

input [`CRC_WIDTH-1:0] crc;

input data1;

begin

crc_data1={crc[`CRC_WIDTH-2:0],1'b0} ^ ({`CRC_WIDTH{(crc[`CRC_WIDTH-1]^data1)}} & POLYNOMINAL);

end

endfunction

function [`CRC_WIDTH-1:0] crc_data;

input [`INPUT_DATA_WIDTH-1:0] data;

input [`CRC_WIDTH-1:0] crc;

integer i;

begin

crc_data=crc;

for(i=0;i<=`INPUT_DATA_WIDTH-1;i=i+1) begin

crc_data=crc_data1(crc_data,data[`INPUT_DATA_WIDTH-1-i]);

end

endfunction

always@(posedge rst or posedge clk)

if(rst)
crc_buf<=0;
else
crc_buf<=crc_data(data_buf,0);

七．有关Verilog和VHDL的一点感悟

以上代码使用了Verilog中的函数和for循环，硬件描述语言里的函数和for循环只是为了缩短代码量，跟软件里的思想有点不一样。在写函数和for循环的时候，应该要想一想这个在硬件电路上表现为什么，而且for循环的次数要固定，因为是要生成一个固定的电路。上面这个程序在一个时钟就可以把CRC计算出，而每次计算for循环都要用到上一次的值，刚开始我认为这个电路结构是这样的：有多少级的for循环就有多少级的组合逻辑，因为数据处理是有先后顺序的嘛。

以下是综合后的模块视图，可以看到只有两级的延迟，源程序是给8bit数据加CRC16。

这个例子让我觉得我们用硬件描述语言只是给出行为级的描述，至于呈现什么样的电路交给综合器。写出的程序看似像软件(for循环、函数)，但综合器可根据描述给出最适合的结果。

Verilog：

always既可描述组合逻辑，也可以描述时序逻辑；assign只能描述组合逻辑。

always中的变量必须是reg，但赋值可以是阻塞(<=)，也可以是非阻塞(=)，reg信号并不只对应非阻塞，reg信号也可用阻塞产生时序逻辑，reg信号也可用非阻塞产生组合逻辑，生成时序还是组合的关键应该是always后面跟的条件以及我们如何描述电路。reg信号只表示该信号将在always中使用，并不代表该信号一定是触发器。

如下程序，表示的是移位寄存器，综合成什么样的电路不取决于变量的类型，而是取决于电路的描述，如果描述出来是个移位寄存器，不管用阻塞还是非阻塞，都会综合成所想要的电路，但并不推荐这么写。

always @(posedge clk or posedge rst) begin
if (rst) begin
// reset
datar1 = 1'd0;
datar2 = 1'd0;
end
else begin
datar2 = datar1;
datar1 = data;
end
end

感觉说了这么多也是蛮绕的，最后给出结论：

1.时序逻辑，可综合成FF

always @(posedge clk or posedge rst) begin
if (rst) begin
// 异步reset
end
else begin

//用非阻塞<=
end
end

2.组合逻辑

always @(a or b) begin
begin

q=a+b;//用阻塞=
end

3.时序加逻辑

always @(posedge clk or posedge rst) begin
if (rst) begin
// 异步reset
end
else begin

q<=a+b; //用非阻塞<=
end
end

平时我们用2、3形式比较多。