[POI2000]公共串

IV.[POI2000]公共串

后缀数组如何应对多个串的情况呢?

答案很简单:把所有串都拼起来

但这又有个问题,拼起来的串不会出现一些错误吗?

没关系,这里就有解决方案了:在相邻的串间插入一个从未出现过的字符

我们考虑在拼起来的字符串中求出\(ht\)数组。则仍然考虑二分公共子串长度\(ip\),在\(ht\)数组里面按照\(ht_x<ip\)的位置分段。然后,如果有一段内部包含了来自所有串的后缀,则当前二分值合法;否则,则不合法。

当然这里还有一种不需要二分的方法,即用two-pointers求出所有出现所有串的区间,并对于每个区间求出内部所有\(ht_x\)\(\min\)(可以用单调队列),对每个区间的结果求\(\max\)即可。但是因为这个方法省略不了后缀数组的\(\log\)(除非你用神奇的DC3),所以复杂度仍为\(O(n\log n)\)

代码:

#include<bits/stdc++.h>
using namespace std;
int all,n,m,x[200100],y[200100],buc[200100],sa[200100],ht[200100],rk[200100],id[200100],s[200100];
bool occ[200100];
char str[200100];
void SA(){
	for(int i=0;i<n;i++)buc[x[i]=s[i]]++;
	for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
	for(int i=n-1;i>=0;i--)sa[--buc[x[i]]]=i;
	for(int k=1;k<n;k<<=1){
		int num=0;
		for(int i=n-k;i<n;i++)y[num++]=i;
		for(int i=0;i<n;i++)if(sa[i]>=k)y[num++]=sa[i]-k;
		for(int i=0;i<=m;i++)buc[i]=0;
		for(int i=0;i<n;i++)buc[x[y[i]]]++;
		for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
		for(int i=n-1;i>=0;i--)sa[--buc[x[y[i]]]]=y[i];
		swap(x,y);
		x[sa[0]]=num=0;
		for(int i=1;i<n;i++)x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
		m=num;
	}
	for(int i=0;i<n;i++)rk[sa[i]]=i;
	for(int i=0,k=0;i<n;i++){
		if(!rk[i])continue;
		if(k)k--;
		int j=sa[rk[i]-1];
		while(i+k<n&&j+k<n&&s[i+k]==s[j+k])k++;
		ht[rk[i]]=k;
	}
}
bool che(int ip){
	for(int i=0,j=0;i<n;i=j){
		if(id[sa[i]]==-1){j++;continue;}
		int k=0;
		k+=!occ[id[sa[i]]],occ[id[sa[i]]]=true;
		for(j=i+1;j<n&&ht[j]>=ip;j++)k+=!occ[id[sa[j]]],occ[id[sa[j]]]=true;
		for(int l=i;l<j;l++)occ[id[sa[l]]]=false;
		if(k==all)return true;
	}
	return false;
}
int main(){
	scanf("%d",&all);
	for(int i=1;i<=all;i++){
		scanf("%s",str);
		m=strlen(str);
		for(int j=0;j<m;j++)id[n]=i,s[n]=(int)str[j]+5,n++;
		id[n]=-1,s[n]=i,n++;
	}
	m='z'+5;
	SA();
//	for(int i=0;i<n;i++)printf("%d ",s[i]);puts("");
//	for(int i=0;i<n;i++)printf("%d ",rk[i]);puts("");
//	for(int i=0;i<n;i++)printf("%d ",ht[i]);puts("");
	int l=0,r=n;
	while(l<r){
		int mid=(l+r+1)>>1;
		if(che(mid))l=mid;
		else r=mid-1;
	}
	printf("%d\n",l);
	return 0;
}

原文地址:https://www.cnblogs.com/Troverld/p/14602339.html