回文自动机与等差数列

CF932G Palindrome Partition

Given a string (s), find the number of ways to split (s) to substrings such that if there are (k) substrings ((p_1, p_2, p_3, dots, p_k)) in partition, then (p_i = p_{k - i + 1}) for all (i (1 ≤ i ≤ k)) and (k) is even.

Since the number of ways can be large, print it modulo (10^9 + 7).

(2 ≤ |s| ≤ 10^6).

题解

详细证明见A bit more about palindromes,这里只有配图的感性理解。

题目转化

题目划分成偶数段的要求很奇怪,不过有一个转化。

考虑 (p_i)(p_{k-i+1}) 两个子串,如果 (p_i) 对应的下标区间是 ([pos,pos+len-1]),那么 (p_{k-i+1}) 对应的就是 ([n-pos-len+2,n-pos+1])

下面举一些例子来感性理解。当 (pos=1) 的时候,

[s_1=s_{n-len+1}\ s_2=s_{n-len}\ vdots ]

如果我们有一个串 (s') 满足

[s'=s_1s_ns_2s_{n-1}s_3s_{n-2}dots ]

那么原来的匹配关系变成了

[s'_1=s'_{2cdot len}\ s'_3=s'_{2cdot len-2}\ vdots ]

于是 (s) 中的一对长为 (len) 的匹配 ((p_i,p_{k-i+1}))(s') 中对应了长为 (2cdot len) 的回文前缀。那么问题就转化成了将 (s') 拆分成偶回文串的方案数。

DP设计

(f[i]) 表示 (s'_{1..i}) 划分为若干长度为偶数的回文串的方案数。得到转移方程:

[f[i]=sum_{j}f[j-1] ]

其中,(s'_{j..i}) 是回文串。那么,每一个 (j) 对应的位置相当于是 (s'_{1..i}) 的回文后缀。

构建出回文树之后沿着last跳fail就可以得到所有的 (j) 的位置。

hack:

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa...

时间复杂度 (O(n^2))

性质挖掘

假设对于某个位置,它对应的若干回文后缀:

graph1

如果他们的长度>len/2,可以证明他们的长度等差

graph2

证明?根据回文串的性质,上面的那些圈圈都是相等的串。证毕。

如果把这一些看成一组,每一组都至少要÷ 2。所以至多只会有log组。这样能够保证复杂度,所以我们考虑能否一组一组转移。

(g[x]) 表示这一组东西的和。因为一组不能直接在串中表示,所以用回文树上的节点来表示。所以,(g[x]) 表示从节点 (x) 开始,一直到缩短的值不再是当前这个等差的位置产生的贡献的和。

graph3

对于这一组,它产生的贡献就是 (g[x]=f[j_1]+f[j_2]+f[j_3])。(最底下那个是原串)

如何维护这个 (g[x]) 呢?往父亲的那些回文后缀看

graph4

他们关于儿子节点对称后的开始位置恰好就是我们要统计的位置,所以 (g[x] +=g[fa_x])。当然前提是 (fa[x]) 还在这一组等差的串里面。

但是我们少统计了最上面的最短的那一段 ,所以 (g[x]+=f[i-len[anc_x]-diff_x])

算法设计

经过上述讨论,我们只需要对 (s’) 构建回文树,维护出 (g) 后,利用log组等差数列的性质暴力更新答案即可。

时间复杂度 (O(n log n))

CO int N=1000000+10;
namespace PAM{
	int str[N],n;
	int last,tot;
	int ch[N][26],trans[N][26],len[N],fa[N];
	int diff[N],anc[N];
	
	void init(){
		memset(str,-1,sizeof str),n=0;
		last=tot=1;
		len[0]=0,len[1]=-1,fa[0]=fa[1]=1;
		fill(trans[0],trans[0]+26,1);
		diff[0]=0;
	}
	void extend(int c){
		str[++n]=c;
		int p=last;
		if(str[n-len[p]-1]!=str[n]) p=trans[p][c];
		if(!ch[p][c]){
			int cur=++tot;
			len[cur]=len[p]+2;
			fa[cur]=ch[trans[p][c]][c];
			ch[p][c]=cur;
			copy(trans[fa[cur]],trans[fa[cur]]+26,trans[cur]);
			trans[cur][str[n-len[fa[cur]]]]=fa[cur];
			diff[cur]=len[cur]-len[fa[cur]];
			anc[cur]=diff[cur]==diff[fa[cur]]?anc[fa[cur]]:fa[cur];
		}
		last=ch[p][c];
	}
}

char tmp[N],str[N];
int dp[N],ans[N];

int main(){
	scanf("%s",tmp+1);
	int n=strlen(tmp+1);
	if(n&1) return puts("0"),0;
	for(int i=1;i<=n;i+=2) str[i]=tmp[(i+1)/2];
	reverse(tmp+1,tmp+n+1);
	for(int i=2;i<=n;i+=2) str[i]=tmp[i/2];
	PAM::init();
	ans[0]=1;
	for(int i=1;i<=n;++i){
		PAM::extend(str[i]-'a');
		for(int p=PAM::last;p;p=PAM::anc[p]){
			dp[p]=ans[i-PAM::len[PAM::anc[p]]-PAM::diff[p]];
			if(PAM::anc[p]!=PAM::fa[p])
				dp[p]=add(dp[p],dp[PAM::fa[p]]);
			if(~i&1) ans[i]=add(ans[i],dp[p]);
		}
	}
	printf("%d
",ans[n]);
	return 0;
}

Timus 100500 palidnromes

For every prefix of some given string, determine whether it is possible to split it into 1, 2, 3, 4, 5, …, n non-empty palindromes. Note that if we can split a string into k palindromes then we can split it into k + 2 palindromes.

1 ≤ n ≤ 3 · 105

从标题来看出题人英语水平一般。

题解

跟前面那道题大同小异,维护 (g[x][0/1]) 表示划分成偶/奇数段的最小划分数。

从这两道题可以看出来,这个 (g[x]) 其实就只是个统计的作用,像线段树一样没有实际意义。

CO int N=300000+10,inf=1e9;
namespace PAM{
	int str[N],n;
	int last,tot;
	int ch[N][26],len[N],fa[N];
	int diff[N],anc[N];
	
	void init(){
		memset(str,-1,sizeof str),n=0;
		last=tot=1;
		len[0]=0,len[1]=-1,fa[0]=fa[1]=1;
		diff[0]=0;
	}
	int get_fail(int x){
		while(str[n-len[x]-1]!=str[n]) x=fa[x];
		return x;
	}
	void extend(int c){
		str[++n]=c;
		int p=get_fail(last);
		if(!ch[p][c]){
			int cur=++tot;
			len[cur]=len[p]+2;
			fa[cur]=ch[get_fail(fa[p])][c];
			ch[p][c]=cur;
			diff[cur]=len[cur]-len[fa[cur]];
			anc[cur]=diff[cur]==diff[fa[cur]]?anc[fa[cur]]:fa[cur];
		}
		last=ch[p][c];
	}
}

char str[N];
int dp[N][2],ans[N][2];

int main(){
	scanf("%s",str+1);
	int n=strlen(str+1);
	PAM::init();
	ans[0][0]=0,ans[0][1]=inf;
	for(int i=1;i<=n;++i){
		PAM::extend(str[i]-'a');
		ans[i][0]=ans[i][1]=inf;
		for(int p=PAM::last;p;p=PAM::anc[p]){
			dp[p][0]=ans[i-PAM::len[PAM::anc[p]]-PAM::diff[p]][0];
			dp[p][1]=ans[i-PAM::len[PAM::anc[p]]-PAM::diff[p]][1];
			if(PAM::fa[p]!=PAM::anc[p]){
				dp[p][0]=min(dp[p][0],dp[PAM::fa[p]][0]);
				dp[p][1]=min(dp[p][1],dp[PAM::fa[p]][1]);
			}
			ans[i][0]=min(ans[i][0],dp[p][1]+1);
			ans[i][1]=min(ans[i][1],dp[p][0]+1);
		}
		printf("%d %d
",ans[i][1]==inf?-1:ans[i][1],ans[i][0]==inf?-2:ans[i][0]);
	}
	return 0;
}
原文地址:https://www.cnblogs.com/autoint/p/12000830.html