CRC循环冗余校验

CRC(Cyclic redundancy check)又称为循环冗余校验,它是一种根据网络数据包或电脑文件等数据产生简短固定位数校验码的一种散列函数,主要用于检测或校验数据传输或者保存后可能出现的错误。生成的校验码在传输或者存储之前计算出来并附加到数据后面,然后接收方进行检验确定数据是否发生变化。

数据通讯校验方法

数据通讯中常见的几种校验方法包括以下几种:

  • 奇偶校验/bit校验
  • 累加和校验
  • 循环冗余校验

奇偶校验

​ 奇偶校验算法包括两种类型,分别是奇校验位和偶校验位。它表示一个给定位数的二进制数中的1的个数是奇数个还是偶数个。

​ 奇偶校验的原理是在发送的每一个字节后都加一位,使得每个字节中1的个数为奇数个或者偶数个(若为奇校验,则1的个数是奇数个,若为偶校验,1的个数为偶数个)。

​ 如要传输的数据为1001 0010 0010 0001。

​ 若采用奇校验,则将每个字节补位,传输的数据为1001 0010 0 0010 0001 1

​ 若采用偶校验,则将每个字节补位,传输的数据为1001 0010 1 0010 0001 0

奇偶校验的缺点

  1. 检测出错的概率较大,错误率在50%左右。
  2. 由于对于每个字节都需要补位,所以对传输性能影响较大。

累加和校验

累加和校验的实现方式有很多种最常用的一种是在一次通讯数据包的最后加入一个字节的校验数据,这个字节的内容为数据包中全部数据的忽略进位的按字节累加。如:

​ 要传输的数据为:

​ 1、2、3

​ 加上校验和之后的数据包为:

​ 1、2、3、6

累加和校验的缺点

​ 当校验单字节时,有1/256的出错概率。

循环冗余校验(CRC)

循环冗余校验的算法思想可以理解为选取一个生成多项式k,将需要传输的数据补位,使得补位后的数据可二进制整除该生成多项式,数据接收方校验数据的方法为看接收后的数据是否能二进制整除k:

 1. 将要传输的数据用二进制形式展开
2. 选定一个数K(称为**生成多项式**),K的二进制长度为W+1,则位宽为W
3. 在要传输的二进制数据后补W个0
4. 用二进制展开后的数据用二进制除法(不进位不借位,减法为二进制中的XOR)除以k,得到的余数即为循环冗余校验和。

示例如下:

crc1

crc2

影响CRC算法的因素

​ 在实际使用,影响CRC的参数模型因素有如下几个:

  • 宽度(WIDTH):即多项式的长度-1。
  • 多项式(POLY):即生成多项式,上述示例中的k,要求生成多项式的最高位必须为1。
  • 初始值(INIT):初始时CRC寄存器中的值,这个值常选为0x0000或0xFFFF
  • 结果异或值(XOR):上述方法计算结果后再与该值异或即得CRC值。

​ 为了使得校验出错率降到最低,业界研究出一些特定的生成多项式用于CRC校验算法。常见的CRC算法有CRC8、CRC16、CRC32、CRC64等等。

使用C语言实现CRC算法

以下算法参考redis源码中CRC16实现方法,是一种比较高效的实现方式。

宽度:16

生成多项式为:0x1021(x16+x12+x5+1)

初始值:0

结果异或值:0

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
static const uint16_t crc16tab[256]= {
0x0000,0x1021,0x2042,0x3063,0x4084,0x50a5,0x60c6,0x70e7,
0x8108,0x9129,0xa14a,0xb16b,0xc18c,0xd1ad,0xe1ce,0xf1ef,
0x1231,0x0210,0x3273,0x2252,0x52b5,0x4294,0x72f7,0x62d6,
0x9339,0x8318,0xb37b,0xa35a,0xd3bd,0xc39c,0xf3ff,0xe3de,
0x2462,0x3443,0x0420,0x1401,0x64e6,0x74c7,0x44a4,0x5485,
0xa56a,0xb54b,0x8528,0x9509,0xe5ee,0xf5cf,0xc5ac,0xd58d,
0x3653,0x2672,0x1611,0x0630,0x76d7,0x66f6,0x5695,0x46b4,
0xb75b,0xa77a,0x9719,0x8738,0xf7df,0xe7fe,0xd79d,0xc7bc,
0x48c4,0x58e5,0x6886,0x78a7,0x0840,0x1861,0x2802,0x3823,
0xc9cc,0xd9ed,0xe98e,0xf9af,0x8948,0x9969,0xa90a,0xb92b,
0x5af5,0x4ad4,0x7ab7,0x6a96,0x1a71,0x0a50,0x3a33,0x2a12,
0xdbfd,0xcbdc,0xfbbf,0xeb9e,0x9b79,0x8b58,0xbb3b,0xab1a,
0x6ca6,0x7c87,0x4ce4,0x5cc5,0x2c22,0x3c03,0x0c60,0x1c41,
0xedae,0xfd8f,0xcdec,0xddcd,0xad2a,0xbd0b,0x8d68,0x9d49,
0x7e97,0x6eb6,0x5ed5,0x4ef4,0x3e13,0x2e32,0x1e51,0x0e70,
0xff9f,0xefbe,0xdfdd,0xcffc,0xbf1b,0xaf3a,0x9f59,0x8f78,
0x9188,0x81a9,0xb1ca,0xa1eb,0xd10c,0xc12d,0xf14e,0xe16f,
0x1080,0x00a1,0x30c2,0x20e3,0x5004,0x4025,0x7046,0x6067,
0x83b9,0x9398,0xa3fb,0xb3da,0xc33d,0xd31c,0xe37f,0xf35e,
0x02b1,0x1290,0x22f3,0x32d2,0x4235,0x5214,0x6277,0x7256,
0xb5ea,0xa5cb,0x95a8,0x8589,0xf56e,0xe54f,0xd52c,0xc50d,
0x34e2,0x24c3,0x14a0,0x0481,0x7466,0x6447,0x5424,0x4405,
0xa7db,0xb7fa,0x8799,0x97b8,0xe75f,0xf77e,0xc71d,0xd73c,
0x26d3,0x36f2,0x0691,0x16b0,0x6657,0x7676,0x4615,0x5634,
0xd94c,0xc96d,0xf90e,0xe92f,0x99c8,0x89e9,0xb98a,0xa9ab,
0x5844,0x4865,0x7806,0x6827,0x18c0,0x08e1,0x3882,0x28a3,
0xcb7d,0xdb5c,0xeb3f,0xfb1e,0x8bf9,0x9bd8,0xabbb,0xbb9a,
0x4a75,0x5a54,0x6a37,0x7a16,0x0af1,0x1ad0,0x2ab3,0x3a92,
0xfd2e,0xed0f,0xdd6c,0xcd4d,0xbdaa,0xad8b,0x9de8,0x8dc9,
0x7c26,0x6c07,0x5c64,0x4c45,0x3ca2,0x2c83,0x1ce0,0x0cc1,
0xef1f,0xff3e,0xcf5d,0xdf7c,0xaf9b,0xbfba,0x8fd9,0x9ff8,
0x6e17,0x7e36,0x4e55,0x5e74,0x2e93,0x3eb2,0x0ed1,0x1ef0
};
uint16_t crc16(const char *buf, int len) {
int counter;
uint16_t crc = 0;
for (counter = 0; counter < len; counter++)
crc = (crc<<8) ^ crc16tab[((crc>>8) ^ *buf++)&0x00FF];
return crc;
}
int main(int argc, char* argv[])
{
std::cout << std::hex << crc16("123", 3) << std::endl;
}

使用boost库计算crc校验和

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
#include <boost/crc.hpp>
#include <iostream>
using namespace std;
using namespace boost;
int main()
{
crc_32_type crc32;
cout << hex;
cout << crc32.checksum() << std::endl;
crc32.process_byte('a');
cout << crc32.checksum() << std::endl;
}

Comment and share

pthread使用barrier栅栏方式同步

Linux中提供了多种同步机制,其中使用barrier(栅栏)是多线程之间进行同步的方法之一。

基本原理

假设多个线程约定一个栅栏,只有当所有的线程都达到这个栅栏时,栅栏才会放行,否则到达此处的线程将被阻塞。

使用场景

程序启动的时候,需要建立一个独立的线程去做一些特殊的工作。比如这个线程需要初始化一些全局配置等等。而主线程启动后,必须等待这个子线程拿到配置信息后,才能继续工作。所以这里就存在一个问题要解决,主线程如何等待这个子线程完成工作后,才继续往下执行呢?

栅栏相关API

1
2
3
4
5
6
7
8
9
10
11
12
#include <pthread.h>
//初始化栅栏,栅栏需要等待到count个线程,才会全部一起放行。
int pthread_barrier_init(pthread_barrier_t *restrict,
const pthread_barrierattr_t *restrict, unsigned count);
//报道函数,当一个线程到达栅栏的时候,就报道。
//所有的线程都报道后,栅栏自然会放行。
int pthread_barrier_wait(pthread_barrier_t *barrier);
栅栏完成历史使命后,当然是功成身退。
int pthread_barrier_destroy(pthread_barrier_t *barrier);

使用示例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
#include <stdio.h>
#include <time.h>
#include <stdlib.h>
#include <string.h>
#include <pthread.h>
#include <unistd.h>
pthread_barrier_t barrier;
void* initor(void* args) {
printf("---------------thread init work(%d)--------------\n", time(NULL));
//模拟初始化工作。
sleep(10);
//到达栅栏
pthread_barrier_wait(&barrier);
printf("--------------thread start work(%d)--------------\n", time(NULL));
sleep(10);
printf("--------------thread stop work(%d)--------------\n", time(NULL));
return NULL;
}
int main(int argc, char* argv[]) {
//初始化栅栏,该栅栏等待两个线程到达时放行
pthread_barrier_init(&barrier, NULL, 2);
printf("**************main thread barrier init done****************\n");
pthread_t pid;
pthread_create(&pid, NULL, &initor, NULL);
printf("**************main waiting(%d)********************\n", time(NULL));
//主线程到达,被阻塞,当初始化线程到达栅栏时才放行。
pthread_barrier_wait(&barrier);
pthread_barrier_destroy(&barrier);
printf("***************main start to work(%d)****************\n", time(NULL));
sleep(30);
pthread_join(pid, NULL);
printf("***************thread complete(%d)***************\n", time(NULL));
return 0;
}

Comment and share

文件描述符限制

文件描述符是系统的一个重要资源,理论上有多少内存就可以创建多少文件描述符,但是在实际实现过程中,一般打开的文件数是系统内存的10%(以KB计算)。

查看当前系统最大的文件描述符数量

1
2
3
4
5
6
#系统最大文件描述符数量
$sysctl -a | grep fs.file-max
1026095(与系统相关)
#当前session最大的文件描述符数量
$ulimit -n
1024

修改当前系统最大文件描述符数量

1
2
3
#永久修改系统的最大描述符数量
#在/etc/sysctl.conf中添加:
fs.file-max=102400

Comment and share

C++作用域运算符

C++作用域运算符是C++运算符中等级最高的。::运算符的本质是:左操作数为域,是一个scope,右操作数是这个scope中的一个名字,它可以是一个scope、class、member、function或者variable等。

google style对域作用符的建议和说明可参考:

http://zh-google-styleguide.readthedocs.io/en/latest/google-cpp-styleguide/scoping/#namespaces

作用域运算符作用

::的作用主要包括以下三种:

  • 全局作用域符(::name)
  • 类作用域符(class::name)
  • 命名空间作用域符(namespace::name)

后两种比较常见,不做说明。全局作用符的作用是:如果程序中既定义了全局变量a,也定义了局部变量a,此时若要访问全局变量a,则需要使用::a来访问全局变量a。

当作为类作用符时可用来决议多继承中的重名成员,指定类成员及函数等。

当作为命名空间域作用符时可有效的防止全局作用域命名冲突。

Comment and share

  • page 1 of 1

魏传柳(2824759538@qq.com)

author.bio


Tencent


ShenZhen,China