CTSC2016 香山的树 (KMP+dp)

我的做法比较奇怪

约定(Sigma)为字符集

显然是要枚举答案，不断增大答案(S)的字典序，求出字典序(>S)的个数，考虑(dp)求解

比较大小可以想到要不断进行前缀匹配，因此考虑 ( ext{kmp})

因为要 (dp) 的是一个循环同构串，不妨直接扩展为无限循环的串，(dp)一个最小的循环节

不妨先考虑没有字典序限制的简单情形，也就是抛开( ext{kmp})判断字典序，计算长度为(i)的方案数

显然此时一个合法的长度为(i)的串只需要满足(i)中不会出现循环

设(f_i)为最小循环节为(i)的答案，一种Naive的思路是直接拿(|Sigma|^i)计算，但是显然长度为(i)的会包含长度为(forall d,d|i)的

即(g_i=|Sigma|^i=sum_{d|i}f(d))，然后直接(O(nln n))减去重复部分即可

由于题目要求是最小的循环，因此实际上每个循环有(i)中不同开始位置，所以答案应是(frac{f_i}{i})

接下来考虑字典序的问题：不妨枚举一个无限循环串(S)的最优匹配位置为(st)，然后(dp)一个长度为(i)的循环节

显然要满足的条件是：

1.(dp)了(i)个字符之后匹配状态为(st)

2.在(dp)过程中如果( ext{kmp})出现失配，必须满足当前字符更大

注意这里有一个问题，当匹配位置恰好等于(|S|)时，可能会将恰好为(S)的情况算入，因此要特判

3.中途不能匹配到比(st)更大的位置

同样的会出现两种重复计算：

1.串内出现了循环

可以考虑同样的容斥方法

2.多个不同的开始位置都合法

这个我的处理方法非常暴力，考虑直接记录匹配过程中恰好为(st)的次数，这些位置都是可能的开始位置

不妨令(dp_{i,j,d})表示当前(dp)了(i)位，匹配状态为(j)，中途出现了(d)个恰好为(st)的匹配位置

可以得到一个(O(n^3|Sigma|))的暴力dp，算上枚举起始位置，复杂度为(O(n^4|Sigma|))

由于还需要按位二分答案，所以复杂度为(O(n^5|Sigma|log |Sigma|))，实际可以通过

一个小优化：每次二分时，只有(st=|S|)或者(st=|S|-1)的部分需要重新(dp)

因此实际复杂度为(O(n^4|Sigma|log |Sigma|))

~~感觉这个(dp)明显太麻烦了，显然可以删掉一些东西~~

#include<bits/stdc++.h>
using namespace std;

typedef __int128 ll;
//本地测试可以改成long long ，并且把下面的U=1e36改为U=1e18
#define rep(i,a,b) for(int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(int i=a,i##end=b;i>=i##end;--i)

char IO;
template <class T=int> T rd(){
	T s=0; int f=0;
	while(!isdigit(IO=getchar())) f|=IO=='-';
	do s=(s<<1)+(s<<3)+(IO^'0');
	while(isdigit(IO=getchar()));
	return f?-s:s;
}

const int N=52,S=26;
const ll U=1e36;

void chk(ll &a){ a>U && (a=U); }

int n,m;
ll k;
char s[N];
int nxt[N],trans[N][S];
void Init_KMP(){
	rep(i,2,m) {
		int j=nxt[i-1];
		while(j && s[i]!=s[j+1]) j=nxt[j];
		if(s[i]==s[j+1]) j++;
		nxt[i]=j;
	}
	rep(i,0,m) {
		rep(j,0,S-1) {
			int k=i,f=1;
			while(s[k+1]!=j+'a') {
				f&=j+'a'>s[k+1];
				if(!k) break;
				k=nxt[k];
			}
			if(s[k+1]==j+'a') k++;
			trans[i][j]=f?k:-1;
		}
	}
}

ll dp[N][N][N];
ll Ans[N];

ll Calc(int k=0){
	m=strlen(s+1),Init_KMP();
	ll ans=0;
	rep(st,(k?0:m-1),m) {
		Ans[st]=0;
		rep(i,0,n) rep(j,0,st) rep(d,0,n) dp[i][j][d]=0;
		dp[0][st][0]=1;
		rep(i,1,n) {
			rep(j,0,st) rep(d,0,i) if(dp[i-1][j][d]){ 
				rep(c,j==m?0:s[j+1]-'a',S-1) if(~trans[j][c]) {
					chk(dp[i][trans[j][c]][d+(trans[j][c]==st)]+=dp[i-1][j][d]);
				}
			}
		}
		rep(i,1,n) rep(d,0,n) if(dp[i][st][d]) {
			if(dp[i][st][d]==U) return U;
			rep(j,2,min(n/i,n/d)) dp[i*j][st][d*j]-=dp[i][st][d];
			if(i>m || st!=m) chk(Ans[st]+=dp[i][st][d]/d); // 特判了恰好为S的情况
		}
	}
	rep(i,0,m) chk(ans+=Ans[i]);
	return ans;
}

int main(){ 
	//freopen("treelabel.in","r",stdin),freopen("treelabel.out","w",stdout);
	scanf("%d%lld%s",&n,&k,s+1);
	k=Calc(1)-k+1;
	if(k<0) return puts("-1"),0;
	rep(i,1,n) {
		int l='a',r='a'+S-1,res=0;
		while(l<=r){
			int mid=(l+r)>>1;
			s[i]=mid,s[i+1]=0;
			if(Calc()>=k) res=mid,l=mid+1;
			else r=mid-1;
		}
		s[i]=res,s[i+1]=0;
		if(!res || Calc()==k) break;
	}
	puts(s+1);
}