POJ2774 Long Long Message (最长公共子串,后缀系列结构)

POJ-2774 Long Long Message (最长公共子串,后缀系列结构)

后缀数组

将两个串接在一起,中间加上一些奇怪的字符

然后就是求下标分别落在两个串中的所有\(i,j\)\(LCP(Suf_i,Suf_j)\)的最大值

按照\(SA\)的顺序可以发现只用考虑最近的\(i,j\),所以对于每个 \(i\) 找到最近的 \(j\) 即可,就是一个尺取

尺取\(L,R\)之后可以用单调队列查询

#include<cstdio>
#include<algorithm>
#include<iostream>
#include<cctype>
#include<cstring>
#include<cassert>
using namespace std;

#define reg register
#define pb push_back
typedef long long ll;
typedef unsigned long long ull;
#define rep(i,a,b) for(reg int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(reg int i=a,i##end=b;i>=i##end;--i)
template <class T> inline void cmin(T &a,T b){ ((a>b)&&(a=b)); }
template <class T> inline void cmax(T &a,T b){ ((a<b)&&(a=b)); }
char IO;
int rd(){
	int s=0;
	int f=0;
	while(!isdigit(IO=getchar())) f|=(IO=='-');
	do s=(s<<1)+(s<<3)+(IO^'0');
	while(isdigit(IO=getchar()));
	return f?-s:s;
}


const int N=2e5+10,INF=1e9;

int n,m;
char s[N];
int cnt[N],tmp[N],rk[N<<1],lcp[N],sa[N];

void PreMake(){
	memset(cnt,0,800);
	rep(i,1,n) cnt[(int)s[i]]++;
	rep(i,1,200) cnt[i]+=cnt[i-1];
	rep(i,1,n) rk[i]=cnt[(int)s[i]],sa[i]=i;
	rep(i,n+1,n*2) rk[i]=0;
	for(reg int k=1;k<=n;k<<=1) {
		rep(i,0,n) cnt[i]=0;
		rep(i,1,n) cnt[rk[i+k]]++;
		rep(i,1,n) cnt[i]+=cnt[i-1];
		drep(i,n,1) tmp[cnt[rk[i+k]]--]=i;
        
		rep(i,0,n) cnt[i]=0;
		rep(i,1,n) cnt[rk[i]]++;
		rep(i,1,n) cnt[i]+=cnt[i-1];
		drep(i,n,1) sa[cnt[rk[tmp[i]]]--]=tmp[i];
        
		rep(i,1,n) tmp[sa[i]]=tmp[sa[i-1]]+(rk[sa[i]]!=rk[sa[i-1]]||rk[sa[i]+k]!=rk[sa[i-1]+k]);
		rep(i,1,n) rk[i]=tmp[i];
	}
	int h=0;
	rep(i,1,n) {
		int j=sa[rk[i]-1];
		if(h) h--;
		while(i+h<=n && j+h<=n && s[i+h]==s[j+h]) h++;
		lcp[rk[i]-1]=h;
	}
}

int GetIndex(int x) {
	x=sa[x];
	if(x<=m) return 1;
	if(x>m+1) return 2;
	return 0;
}

int c[4];
int Q[N],l=1,r;


int main(){
	scanf("%s",s+1),m=strlen(s+1);
	s[m+1]='#';
	scanf("%s",s+m+2),n=strlen(s+1);
	PreMake();
	int ans=0;
	for(reg int L=1,R=1;R<=n;++R) {
		c[GetIndex(R)]++;
		if(R-1>=L) {
			while(l<=r && lcp[Q[r]]>lcp[R-1]) r--;
			Q[++r]=R-1;
		}
		while(!GetIndex(L)||c[GetIndex(L)]>1) --c[GetIndex(L++)] ;
		while(l<=r && Q[l]<L) l++;
		if(c[1]&&c[2]) cmax(ans,lcp[Q[l]]);
	} // 尺取L,R 单调队列维护查询
	printf("%d\n",ans);
}





\[\ \]

后缀自动机

当然可以像类似上面那样地去做,但是会比较慢,内存也会大

可以对于第一个串构建自动机,第二个串对于每个前缀,直接逐个匹配最长公共的的后缀

也就是逐个字符转移下来,如果不存在转移就不断返回\(link\),直到存在转移或为空,注意同时维护当前长度

#include<cstdio>
#include<cstring>
#include<cctype>
using namespace std;

#define reg register
typedef long long ll;
#define rep(i,a,b) for(int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(int i=a,i##end=b;i>=i##end;--i)

#define pb push_back
template <class T> inline void cmin(T &a,T b){ ((a>b)&&(a=b)); }
template <class T> inline void cmax(T &a,T b){ ((a<b)&&(a=b)); }

char IO;
int rd(){
	int s=0,f=0;
	while(!isdigit(IO=getchar())) if(IO=='-') f=1;
	do s=(s<<1)+(s<<3)+(IO^'0');
	while(isdigit(IO=getchar()));
	return f?-s:s;
}

const int N=2e5+10;

bool be;

int n;
char s[N];
int trans[N][26];
int lst,stcnt;
int len[N],link[N],ma[N];

struct Edge{
	int to,nxt;
}e[N];
int head[N],ecnt;
void AddEdge(int u,int v) {
	ecnt++;
	e[ecnt].to=v,e[ecnt].nxt=head[u];
	head[u]=ecnt;
}

ll ans;
int vis[N];

bool ed;

void Init(){ 
	link[0]=-1,len[0]=0;
	rep(i,0,stcnt) {
		len[i]=head[i]=ma[i]=0;
		rep(j,0,25) trans[i][j]=0;
		vis[i]=0;
	}
	stcnt=lst=ecnt=0;
}

void Extend(int c) {
	int cur=++stcnt,p=lst;
	len[cur]=len[lst]+1;
	while(~p && !trans[p][c]) trans[p][c]=cur,p=link[p];
	if(p==-1) link[cur]=0;
	else {
		int q=trans[p][c];
		if(len[q]==len[p]+1) link[cur]=q;
		else {
			int clone=++stcnt;
			link[clone]=link[q];
			memcpy(trans[clone],trans[q],104);
			len[clone]=len[p]+1;
			while(~p && trans[p][c]==q) trans[p][c]=clone,p=link[p];
			link[q]=link[cur]=clone;
		}
	}
	lst=cur;
}


int main(){
	scanf("%s",s+1);
	n=strlen(s+1);
	Init();
	rep(i,1,n) Extend(s[i]-'a');
	int ans=0;
	scanf("%s",s+1);
	int len=strlen(s+1);
	int p=0,nowlen=0;
	rep(i,1,len) {
		int c=s[i]-'a';
		while(p && !trans[p][c]) {
			p=link[p];
			cmin(nowlen,(~p?::len[p]:0));
		}
		if(trans[p][c]) {
			p=trans[p][c];
			nowlen++;
		}
		cmax(ans,nowlen);
	}
	printf("%d\n",ans);
}






原文地址:https://www.cnblogs.com/chasedeath/p/12213441.html