BZOJ4198 [Noi2015]荷马史诗

本文版权归ljh2000和博客园共有,欢迎转载,但须保留此声明,并给出原文链接,谢谢合作。

本文作者:ljh2000
作者博客:http://www.cnblogs.com/ljh2000-jump/
转载请注明出处,侵权必究,保留最终解释权!

Description

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
 

Input

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
 

Output

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
 

Sample Input

4 2
1
1
2
2

Sample Output

12
2

HINT

 

用 X(k) 表示 X 是以 k 进制表示的字符串。

一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:

 

1×2+1×2+2×2+2×2=12

最长字符串 si 的长度为 2。

 

一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:

 

1×3+1×3+2×2+2×1=12

最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。

 

对于所有数据,保证 2≤n≤100000,2≤k≤9。

 

选手请注意使用 64 位整数进行输入输出、存储和计算。

 

正解:Huffman树+贪心

解题报告:

  这道题对于思维上来说是一道好题,在考场上还真不一定一下子就想出来...

  不过这个模型倒是让我很快联想到了Huffman树23333

  参考博客:http://blog.csdn.net/cqbzwja/article/details/46974241 以及 http://blog.csdn.net/morestep/article/details/47665135

  考虑我们常规的二叉Huffman树就是每次取出权值最小的两个结点合并,将两个结点的权值的和作为一个新的结点继续合并,堆维护即可,当然跟合并果子的做法是一样的。值得一提的是这道题就是需要一棵k叉Huffman树,来保证合法性,同时由于我们每次取出的是权值最小的k个所以可以保证总代价最小。

  yy一下可以发现,Huffman树之所以可以保证合法性,是因为加入了许多虚拟结点,保证了一定不会有一个是另一个前缀的情况,考虑一个结点到根结点的路径上的所有点一定都是虚拟结点,所以很容易确定构造方法的合法。

  另外,由于需要保证最大的长度最小,那么我们就在权值相等的时候按深度从小到大排序,优先合并深度小的,可以发现先合并的深度一定大于等于后合并的。

//It is made by ljh2000
#include <iostream>
#include <cstdlib>
#include <cstring>
#include <cstdio>
#include <cmath>
#include <algorithm>
#include <queue>
using namespace std;
typedef long long LL;
int n,k,ans2;
LL ans;
struct node{
	LL val;
	int deep;
	inline bool operator < (const node &a) const {
		if(a.val==val) return a.deep<deep;
		return a.val<val;
	}
}tmp;
priority_queue<node>Q;
inline LL getint(){
    LL w=0,q=0; char c=getchar(); while((c<'0'||c>'9') && c!='-') c=getchar();
    if(c=='-') q=1,c=getchar(); while (c>='0'&&c<='9') w=w*10+c-'0',c=getchar(); return q?-w:w;
}

inline void work(){
	scanf("%d%d",&n,&k); LL x;
	for(int i=1;i<=n;i++) {	x=getint();	Q.push((node){x,1}); }
	int remain=(n-1)%(k-1); 
	if(remain!=0) { remain=k-1-remain; n+=remain; }
	for(int i=1;i<=remain;i++) Q.push((node){0,1});
	while(n>1) {
		int maxd=0; LL tot=0;
		for(int i=1;i<=k;i++) {
			tmp=Q.top(); Q.pop();
			tot+=tmp.val;//只需加一次即可,因为以后每层都要加一次
			maxd=max(maxd,tmp.deep);//最大深度,作为排序的依据
		}		
		Q.push((node){tot,maxd+1});
		ans+=tot;
		ans2=max(ans2,maxd);
		n-=k-1;
	}
	printf("%lld
",ans);
	printf("%d",ans2);
}

int main()
{
    work();
    return 0;
}

  

原文地址:https://www.cnblogs.com/ljh2000-jump/p/6272789.html