【视频编解码·学习笔记】9. 熵编码算法:指数哥伦布编解码程序

一、解码程序:

整体思路:

  1. 在数据流中从左向右读取每一个二进制数据
  2. 记录前缀连零的个数(m),遇到1停止记录。并提取后缀信息位(信息位长度与前缀0个数相同)
  3. 将后缀二进制转换成十进制数(k)
  4. 解码数值:(decodeNum = 2^m - 1 + k)
  5. 重复步骤1-4,直到数据序列结束

新建一个VS工程,定义数据类型:

typedef unsigned char UINT8;

定义一个数组用来存储待解码的数据:

UINT8 strArray[6] = { 0xA6, 0x43, 0x98, 0xE2, 0x04, 0x8A };

1. 提取每一位二进制函数:

需要三个参数:待解码数据序列buf,解码到第几个字节bytePosition,第几位bitPosition (都是从左向右数的,每个字节自第一位bitPosition=0,最后一位bitPosition=7)

static int get_bit_at_position(UINT8 *buf, UINT8 &bytePosition, UINT8 &bitPosition)
{
	UINT8 mask = 0, val = 0;
	// mask用来表示提取第几位的数据,eg:0001 0000,表示提取第5位的数据
	mask = 1 << (7 - bitPosition);
	// 将当前字节数据与mask进行按位与运算,只保留那一位上的数据,整体数据!=0表明那一位数据为1
	// val保存bytePosition上,第bitPosition的值
	val = ((buf[bytePosition] & mask) != 0);
	// 如果读到字节末尾,修改两个Position的值
	if (++bitPosition > 7)
	{
		bytePosition++;
		bitPosition = 0;
	}
	return val;
}

2. 解码部分:

参照公式:(decodeNum = 2^m - 1 + k)(m)为前面0的个数,(k)为后缀二进制对应十进制的值

static int get_uev_code_num(UINT8 *buf, UINT8 &bytePosition, UINT8 &bitPosition)
{
	assert(bitPosition < 8);
	UINT8 val = 0, prefixZeroCount = 0;		//存储每一位的数值; 前缀0的个数
	int prefix = 0, surfix = 0, decodeNum = 0;
	
	//统计前缀0的个数
	while (true)
	{
		val = get_bit_at_position(buf, bytePosition, bitPosition);
		if (val == 0)
		{
			prefixZeroCount++;
		}
		else
		{
			break;
		}
	}
	// 表示计算公式中 2^m - 1 部分
	prefix = (1 << prefixZeroCount) - 1;
	// 计算后缀中二进制转十进制部分 k
	for (size_t i = 0; i < prefixZeroCount; i++)
	{
		val = get_bit_at_position(buf, bytePosition, bitPosition);
		surfix += val*(1 << (prefixZeroCount - i - 1));
	}

	decodeNum = prefix + surfix;
	return decodeNum;
}

3. 修改主函数

int _tmain(int argc, _TCHAR* argv[])
{
	UINT8 strArray[6] = { 0xA6, 0x43, 0x98, 0xE2, 0x04, 0x8A };
	UINT8 bytePosition = 0, bitPosition = 0;
	// 保存bit数据长度
	UINT8 dataLengthInBits = sizeof(strArray) * 8;

	// 保存解码后的数据
	int decodeNum = 0;
	while ((bytePosition * 8 + bitPosition) < dataLengthInBits)
	{
		decodeNum = get_uev_code_num(strArray, bytePosition, bitPosition);
		printf("ExpColumb codeNum = %d
", decodeNum);
	}

    return 0;
}

运行结果如下:
1 解码结果

二、编码程序:

定义待编码数组,及编码后存储的数组:

UINT8 oriNumArray[10] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };    // 带编码数组
UINT8 encodeArray[6] = { 0 };	// 存储指数哥伦布编码后的结果

整体思路:
以codeNum = 13为例,
① 前缀0的个数:(prefixLen = floor[log_2(codeNum+1)] = 3)
② 中间添加一个 1
③ 后缀部分的二进制:(codeNum+1-2^{prefixLen} = 14-8 = 6 = b(1 1 0))
因此13的指数哥伦布编码码字为0 0 0 1 1 1 0。

1. 编码部分:

与解码部分相同,使用了bytePosition和bitPosition表示写入位置。
【使用按位或的方式,按位写入每一位数据】
例如:该写某一字节code的第五位,这一个字节为 1101 0000,要在第五位上写入1(0同理),
创建一个mask -> 0000 1000,将code这个字节与mask进行按位或运算,即可将1写入到第五位上
code | mask = 1101 1000

static void encode_uev_array(UINT8 *encodeArray, UINT8 codeNum, UINT8 &bytePosition, UINT8 &bitPosition)
{
	// 前缀0
	int preZeroLen = floor(log(codeNum + 1) / log(2));
	bitPosition = bitPosition + preZeroLen;
	if (bitPosition > 7)
	{
		bytePosition++;
		bitPosition = bitPosition % 8;
	}

	// 中间1
	UINT8 mask = 1 << (7 - bitPosition);
	encodeArray[bytePosition] = encodeArray[bytePosition] | mask;
	if (++bitPosition > 7)
	{
		bytePosition++;
		bitPosition = 0;
	}

	// 后缀二进制
	int surDecNum = codeNum + 1 - pow(2, preZeroLen);
	dec_to_bin(encodeArray, surDecNum, bytePosition, bitPosition, preZeroLen);
}

2. 十进制转二进制:

static void dec_to_bin(UINT8 *encodeArray, UINT8 decNum, UINT8 &bytePosition, UINT8 &bitPosition, int preZeroLen)
{
	if (preZeroLen == 0)
	{
		return;
	}
	// 转换二进制用的mask
	UINT8 maskBin = 1 << (preZeroLen - 1);
	// 按位写数据用的mask
	UINT8 maskVal;
	UINT8 val = 0;

	// 写入二进制后缀
	for (size_t i = 0; i < preZeroLen; i++)
	{
		val = (decNum & maskBin ? 1 : 0);

		maskVal = val << (7 - bitPosition);
		encodeArray[bytePosition] = encodeArray[bytePosition] | maskVal;
		if (++bitPosition > 7)
		{
			bytePosition++;
			bitPosition = 0;
		}
		maskBin = maskBin >> 1;
	}
}

3. 主函数:

UINT8 encodeArray[6] = { 0 };
UINT8 bytePosition = 0, bitPosition = 0;
UINT8 oriNumArray[10] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };
UINT8 oriNumLen = sizeof(oriNumArray) / sizeof(UINT8);

for (size_t i = 0; i < oriNumLen; i++)
{
	encode_uev_array(encodeArray, oriNumArray[i], bytePosition, bitPosition);
	printf("%d 
", bitPosition);*/
}

for (size_t k = 0; k < 6; k++)
{
	printf("%x ", encodeArray[k]);
}

运行结果如下,与第一部分中待解码数组中数据相同,证明编解码部分程序能正确执行。
2

原文地址:https://www.cnblogs.com/shuofxz/p/8528803.html