CF 452E. Three strings(后缀数组+并查集)

传送门

解题思路

  感觉这种题都是套路之类的??首先把三个串并成一个,中间插入一些奇怪的字符,然后跑遍(SA)。考虑按照(height)分组计算,就是每个(height)只在最高位计算一次,然后求个后缀和,这个可以并查集来实现。具体就是记一个(sum[i][3])表示第(i)个联通块中(0,1,2)的个数,(0,1,2)就是出现在三个串的哪一个,然后合并时需要容斥一下。

代码

#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>

using namespace std;
const int N=300005;
const int MOD=1e9+7;

char s[N];
int fa[N],sum[N][3],n,m,Len,id[N],height[N],ans[N],type[N];

struct SA{
	int X[N<<1],Y[N<<1],rk[N],sa[N],c[N],num;
	void get_SA(){
		for(int i=1;i<=n;++i) X[i]=s[i],c[X[i]]++;
		for(int i=2;i<=m;++i) c[i]+=c[i-1];
		for(int i=n;i;--i) sa[c[X[i]]--]=i;
		for(int k=1;k<=n;k<<=1){ num=0;
 			for(int i=n-k+1;i<=n;++i) Y[++num]=i;
 			for(int i=1;i<=n;++i) if(sa[i]>k) Y[++num]=sa[i]-k;
 			memset(c,0,sizeof(c));
 			for(int i=1;i<=n;++i) c[X[i]]++;
 			for(int i=2;i<=m;++i) c[i]+=c[i-1];
 			for(int i=n;i;--i) sa[c[X[Y[i]]]--]=Y[i],Y[i]=0;
 			swap(X,Y); X[sa[1]]=1; num=1;
 			for(int i=2;i<=n;++i)
 				X[sa[i]]=(Y[sa[i]]==Y[sa[i-1]] && Y[sa[i]+k]==Y[sa[i-1]+k])?num:++num;
 			m=num; if(m==n) break;
		}
	}
	void get_height(){
		for(int i=1;i<=n;++i) rk[sa[i]]=i;
		int j,k=0;
		for(int i=1;i<=n;++i){
			if(rk[i]==1) continue;
			if(k) k--; j=sa[rk[i]-1];
			while(j+k<=n && i+k<=n && s[i+k]==s[j+k]) k++;
			height[rk[i]]=k;
		}
	}
}t;

inline bool cmp(int x,int y){
	return height[x]>height[y];
}	

int get(int x){
	if(x==fa[x]) return x;
	return fa[x]=get(fa[x]);
}

int main(){
	char ss[N]; int len;
	scanf("%s",ss+1); len=strlen(ss+1); Len=len;
	for(int i=1;i<=len;++i) s[++n]=ss[i],type[n]=1;
	s[++n]='#'; type[n]=-1;
	scanf("%s",ss+1); len=strlen(ss+1); Len=min(Len,len);
	for(int i=1;i<=len;++i) s[++n]=ss[i],type[n]=2;
	s[++n]='#'+1; type[n]=-1;
	scanf("%s",ss+1); len=strlen(ss+1); Len=min(Len,len);
	for(int i=1;i<=len;++i) s[++n]=ss[i],type[n]=3;
	m='z'; t.get_SA(); t.get_height();
	for(int i=1;i<=n;i++) id[i]=i,fa[i]=i;
	for(int i=1;i<=n;i++){
		if(type[i]==1) sum[i][0]=1;
		if(type[i]==2) sum[i][1]=1;
		if(type[i]==3) sum[i][2]=1;
	}
	sort(id+1,id+1+n,cmp); int now=1,tmp=0,u,v;
	for(int i=Len;i;i--){
		while(now<=n && height[id[now]]>=i) {
			u=get(t.sa[id[now]-1]),v=get(t.sa[id[now]]);
			tmp-=(1ll*sum[u][0]*sum[u][1]%MOD*sum[u][2]%MOD);
			tmp=(tmp+MOD)%MOD;
			tmp-=(1ll*sum[v][0]*sum[v][1]%MOD*sum[v][2]%MOD);
			tmp=(tmp+MOD)%MOD;
			sum[u][0]=(sum[u][0]+sum[v][0])%MOD;
			sum[u][1]=(sum[u][1]+sum[v][1])%MOD;
			sum[u][2]=(sum[u][2]+sum[v][2])%MOD;
			tmp=tmp+(1ll*sum[u][0]*sum[u][1]%MOD*sum[u][2]%MOD)%MOD;
			tmp%=MOD; now++; fa[v]=u;
		}
		ans[i]=tmp;
	}
	for(int i=1;i<=Len;i++) printf("%d ",ans[i]);
	return 0;
}
原文地址:https://www.cnblogs.com/sdfzsyq/p/10440603.html