第二次作业

参考书《数据压缩导论（第四版）》 Page 66

　　2、 利用程序huff_enc和huff_dec进行以下操作（在每种情况下，利用由被压缩图像生成的码本）。

　　　　（a）对Sena、Sensin和Omaha图像进行编码

　　　　　　　答：表格如下：　

　　　　（b）编写一段程序，得到相邻像素之差，然后利用huffman对差值图像进行编码

　　　　　　答：

　　4、一个信源从符号集A={a₁, a₂, a₃, a₄, a₅}中选择字母，概率为P（a₁）=0.15，P（a₂）=0.04，P（a₃）=0.26，P（a₄）=0.05，P（a₅）=0.50。

　　　　（a）计算这个信源的熵

　　　　　答：由题目可知：P（a₁）=0.15，P（a₂）=0.04，P（a₃）=0.26，P（a₄）=0.05，P（a₅）=0.50

　　　　　　　　所以：H=-0.15log₂0.15-0.04log₂0.04-0.26log₂0.26-0.05log₂0.05-0.50log₂0.50

　　　　　　 =0.15*2.737+0.04*4.644+0.26*1.943+0.05*4.322+0.50*1

　　　　　　 =0.411+0.186+0.505+0.216+0.5

　　　　　　 =1.82(bits)

　　　　（b）求这个信源的霍夫曼码

　　　　　　答：表格如下：

　　　　（c）求（b）中代码的平均长度及其冗余度

　　　　　　答：平均码长 l=1*0.5+2*0.26+3*0.15+4*0.05+4*0.04

　　　　　　=1.83(bits)

　　　　　冗余度 l-H=1.83-1.818=0.012

　　5、一个符号集A={a₁, a₂, a₃, a₄}，其概率为P（a₁）=0.1，P（a₂）=0.3，P（a₃）=0.25，P（a₄）=0.35，使用以下过程找出一种霍夫曼码：

　　　　（a）本章概述的第一种过程

　　　　　　答：表格如下：

　　　　（b）最小方差过程

　　　　　　答：表格如下：

　　　　解释这两种霍夫曼码的区别

　　　　答：第一种过程与第二种过程的平均码长均为： l=1*0.35+2*0.3+3*0.25+3*0.1=2(bits)

　　　　　　第一种过程码长方差：S₁²=0.35(1-2)²+0.3(2-2)²+0.25(3-2)²+0.1(3-2)²=0.7

　　　　　　最小方差过程码长方差：S₂²=（0.1+0.25+0.3+0.35）(2-2)²=0

　　　　　　由上述计算结果可知，在平均码长值相等的情况下，最小方差法的码长方差较小，因此第二种过程更易实现。

参考书《数据压缩导论（第4版）》 Page 30

　 2-6. 在本书配套的数据集中有几个图像和语音文件。

　　　　(a) 编写一段程序，计算其中一些图像和语音文件的一阶熵

　　　　　　答：运算结果如表格所示：

　　　　 (b) 选择一个图像文件，并计算其二阶熵。试解释一阶熵和二阶熵之间的差别

　　　　　　答：由上表格的数据可知，图像文件的一阶熵都要比其二阶熵要大。

　　　　　　答：对于img格式的图像文件，其差分熵都处于一阶熵与二阶熵之间；对于raw以及txt格式的文件，其差分熵都比其一阶熵与二阶熵要大。