题目描述:
编写一个哈夫曼编码译码程序。针对一段文本,根据文本中字符出现频率构造哈夫曼树,给出每个字符的哈夫曼编码,并进行译码,计算编码前后文本大小。
为确保构建的哈夫曼树唯一,本题做如下限定:
- 选择根结点权值最小的两棵二叉树时,选取权值较小者作为左子树。
- 若多棵二叉树根结点权值相等,则先生成的作为左子树,后生成的作为右子树,具体来说:i) 对于单结点二叉树,优先选择根结点对应字母在文本中最先出现者,如文本为cba,三个字母均出现1次,但c在文本中最先出现,b第二出现,故则选择c作为左子树,b作为右子树。ii) 对于非单结点二叉树,先生成的二叉树作为左子树,后生成的二叉树作为右子树。iii. 若单结点和非单结点二叉树根结点权值相等,优先选择单结点二叉树。
- 生成哈夫曼编码时,哈夫曼树左分支标记为0,右分支标记为1。
输入格式:
输入为3行。第1行为一个字符串,包含不超过5000个字符,至少包含两个不同的字符,每个字符为a-z的小写字母。第2、3行为两个由0、1组成的字符串,表示待译码的哈夫曼编码。
输出格式:
输出第一行为用空格间隔的2个整数,分别为压缩前后文本大小,以字节为单位,一个字符占1字节,8个二进制位占1字节,若压缩后文本不足8位,则按1字节算。输出从第二行开始,每行为1个字符的哈夫曼编码,按各字符在文本中出现次数递增顺序输出,若多个字符出现次数相同,则按其在文本出现先后排列。每行格式为“字母:编码”。最后两行为两行字符串,表示译码结果,若译码失败,则输出INVALID。
输入样例:
cbaxyyzz
0100
011
输出样例:
8 3
c:100
b:101
a:110
x:111
y:00
z:01
zy
INVALID
8 3 c:100 b:101 a:110 x:111 y:00 z:01 zy INVALID
思路:先用优先队列建树,然后深搜探索出每个字符的编码,再对比特流进行译码即可。
AC代码:
#includeusing namespace std; struct node{ char date;//记录字符 int HZ;//记录频率 int qz;//记录优先值 node* left;//左子树 node* right;//右子树 }; struct cmp{//优先队列排序规则 bool operator()(const node* x,const node* y){ if(x->HZ!=y->HZ)return x->HZ>y->HZ; else return x->qz>y->qz; } }; string x,y,z; int bj,wpl=0,jh; map mp,yxj;//记录频率和优先值 vector ym;//记录译出的码 priority_queue ,cmp>q,rnm; map >bm;//记录各字符编码 vector v; void dfs(node* BT){ if(BT){ if(islower(BT->date)){ bm[BT->date]=v; } v.push_back(0); dfs(BT->left); v.pop_back(); v.push_back(1); dfs(BT->right); v.pop_back(); } } void ym(string x){//译码函数 ym.clear(); node* t=new node; t=q.top(); jh=1; for(int i=0;i left; else t=t->right; if((i==(x.size()-1))&&isupper(t->date))jh=0; if(islower(t->date)){ ym.push_back(t->date); t=q.top(); } } if(jh)for_each(ym.begin(),ym.end(),[](char x){cout< >x>>y>>z; for(auto k:x){ mp[k]++; if(yxj[k]==0)yxj[k]=bj++; } for(auto k:mp){ node* t=new node; t->date=k.first; t->HZ=k.second; t->qz=yxj[k.first]; t->left=t->right=nullptr; q.push(t); rnm.push(t); } while(q.size()!=1){//构建哈夫曼树 node* a=new node; a=q.top(); q.pop(); node* b=new node; b=q.top(); q.pop(); node* t=new node; t->date='A'; t->qz=bj++; t->HZ=a->HZ+b->HZ; t->left=a; t->right=b; q.push(t); wpl+=t->HZ; } cout< date; cout<



