Huffman树

实验题目(共6题, 第1题)

标题: Huffman树
时 限: 1000 ms
内存限制: 10000 K
总时限: 3000 ms
描述:
Huffman树

对输入的英文大写字母进行统计概率 然后构建哈夫曼树,输出是按照概率降序排序输出Huffman编码。

输入:
大写字母个数 n
第一个字母 第二个字母 第三个字母 ...  第n个字母
输出:
字母1 出现次数 Huffman编码
字母2 出现次数 Huffman编码
字母3 出现次数 Huffman编码
字母n 出现次数 Huffman编码
输入样例:
10
I I U U U I U N U U
输出样例:
U 6 1
I 3 01
N 1 00
 
提示: 参见教材144
来源:  
提交代码

#include <stdio.h>
#include <stdlib.h>
#include <string.h>


#define MAX  27
#define MAX_INT  99999


//哈夫曼树和哈夫曼编码的存储表示
typedef struct
{
    int weight;
    int parent,lchild,rchild;
} HTNode,*HuffmanTree; // 动态分配数组存储哈夫曼树


typedef char **HuffmanCode;


typedef struct Charnode
{
    char c;
    int weight;
} CharNode,*CharNodePtr; //不要定义为Char


CharNode *b;


int Chat_get()
{
    char c;
    int j=0;
    int m;
    int i;
    scanf("%d",&m);
    getchar();
    b=(CharNodePtr)malloc(sizeof(CharNode)*MAX);
    int a[MAX];
    for(i=0; i<MAX; i++)
    {
        a[i]=0;
    }
    for(i=0; i<m; i++)
    {
        scanf("%c",&c);
        getchar();
        a[c-'A']++;
    }
    for(i=0; i<26; i++)
    {
        if(a[i]!=0)
        {
            b[j].c=char(i+'A');
            b[j].weight=a[i];
            j++;
        }
    }
    return j;
}//得到不同字符的个数和数组


int min(HuffmanTree t,int i)
{
    int j,flag;
    int k=MAX_INT; // 取k为不小于可能的值
    for(j=1; j<=i; j++)
        if(t[j].weight<k&&t[j].parent==0)
            k=t[j].weight,flag=j;
    t[flag].parent=1;
    return flag;
}


//本实习题中右子树是最小值对应序号,左子树是次小值对应序号
void select(HuffmanTree t,int i,int &s1,int &s2)
{
    s2=min(t,i);
    s1=min(t,i);
}


void PrintHuffmanTree(HuffmanTree &HT,HuffmanCode &HC, int n)
{
    int i, c, cdlen;
    char *cd;
    HC=(HuffmanCode)malloc((n+1)*sizeof(char*));
    // 分配n个字符编码的头指针向量([0]不用)
    cd=(char*)malloc(n*sizeof(char)); // 分配求编码的工作空间
    c=2*n-1;
    cdlen=0;
    for(i=0; i<=c; ++i) HT[i].weight=0; // 遍历赫夫曼树时用作结点状态标志
    while(c)
    {
        if(HT[c].weight==0)   // 向左
        {
            HT[c].weight=1;
            if(HT[c].lchild==0 && HT[c].rchild==0)  // 登记叶子结点字符编码
            {
                HC[c]=(char *)malloc((cdlen+1)*sizeof(char));
                cd[cdlen]='\0';
                strcpy(HC[c],cd); // 复制编码(串)
            }
            if(HT[c].lchild!=0)
            {
                c=HT[c].lchild;
                cd[cdlen++]='1';
            }
        }
        else if(HT[c].weight==1)   // 向右
        {
            HT[c].weight=2;
            if(HT[c].rchild!=0)
            {
                c=HT[c].rchild;
                cd[cdlen++]='0';
            }
        }
        else
        {
            HT[c].weight=0;
            c=HT[c].parent;
            --cdlen; // 退到父结点,编码长度减1
        }
    }
    free(cd);
}


// w存放n个字符的权值(均>0),构造哈夫曼树HT,并求出n个字符的哈夫曼编码HC
void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int *w,int n)
{
    int m,i,s1,s2;


    HuffmanTree p;


    if(n<=1)   exit(0);
    m=2*n-1;
    HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode)); // 0号单元未用
//因为0号单元未用,处理数据时候从1号单元开始
    for(p=HT+1,i=1; i<=n; ++i,++p,++w)
    {
        (*p).weight=*w;
        (*p).parent=0;
        (*p).lchild=0;
        (*p).rchild=0;
    }
    for(; i<=m; ++i,++p)  (*p).parent=0;
    // 在HT[1~i-1]中选择parent为0且weight最小的两个结点,其序号分别为s1和s2
    for(i=n+1; i<=m; ++i)   // 建哈夫曼树
    {
        select(HT,i-1,s1,s2);
        HT[s1].parent=HT[s2].parent=i;
        HT[i].lchild=s1;
        HT[i].rchild=s2;
        HT[i].weight=HT[s1].weight+HT[s2].weight;
    }
    //顺序输出哈夫曼树
    PrintHuffmanTree(HT, HC, n);
}


void sort_b(int k)
{
    int n;
    char c;
    int i,j;
    for(i=0; i<k; i++)
    {
        for(j=k-1; j>=i; j--)
        {
            if(b[j].weight>b[j-1].weight)
            {
                n=b[j].weight;
                b[j].weight=b[j-1].weight;
                b[j-1].weight=n;
                c=b[j].c;
                b[j].c=b[j-1].c;
                b[j-1].c=c;
            }
        }
    }
}


int main()
{
    int k;
    int j;
    int i;
    HuffmanTree HT;
    HuffmanCode HC;
    k=Chat_get();
    int *w;
    w=(int *)malloc(sizeof(int)*k);
    sort_b(k);
    for(i=0; i<k; i++)
    {
        w[i]=b[i].weight;
    }
    HuffmanCoding(HT,HC,w,k);
    for(i=0,j=1; i<k; j++,i++)
    {
        printf("%c %d %s\n",b[i].c,b[i].weight,HC[j]);
    }
    return 0;
}

原文地址:https://www.cnblogs.com/ronaldHU/p/2490784.html