P4770[NOI2018]你的名字【SAM,线段树合并】

正题

题目链接:https://www.luogu.com.cn/problem/P4770


题目大意

给出一个长度为\(n\)的字符串\(S\)\(q\)次询问给出一个串\(T\)和一个区间\([L,R]\),求\(T\)有多少个本质不同的子串不是\(S_{L\sim R}\)的子串。

\(1\leq n\leq 5\times 10^5,1\leq Q\le 10^5,\sum|T|\leq 10^6\)


解题思路

因为给了很多\(L=1,R=n\)的部分分所以应该是提示我们先从这个方面考虑。
这个部分比较简单,考虑改为求有多少个本质不同的子串在\(S_{L\sim R}\)中出现过,因为是本质不同的子串,我们可以先建一个\(S\)\(SAM\)和一个\(T\)\(SAM\)

然后把\(T\)串拿到\(S\)\(SAM\)上面跑,然后每次跑出来的一个匹配长度记为\(len\)。对于\(T\)\(SAM\)上的每一个节点我们记录一个\(pos\)表示这个节点属于的长度位置,然后跑到这个位置的\(len\)就是能够匹配的长度了,记为\(ans\)。然后答案就是\(max\{len_i-max\{ans_{pos_i},len_{fa_i}\},0\}\)(防匹配长度超出\([len_{fa_i},len_i]\)的范围)

这样一次的时间复杂度就是\(O(|T|)\)的了。

然后考虑带区间的怎么做,我们需要保证我们在\(S\)\(SAM\)上面跳的时候需要保证这些节点都是属于\(S_{L\sim R}\)的自动机上的,而且要保证我们提取出来的\(len\)也是在那个上面的。

其实如果这个节点的\(endpos\)类里面有\(L\sim R\)的信息就好了,这个用线段树合并维护一下\(endpos\)类的信息就可以了。

时间复杂度\(O((n+\sum |T|)\log n)\)


code

#include<cstdio>
#include<cstring>
#include<algorithm>
#define ll long long
using namespace std;
const int N=1e6+10;
int n,q,ql,qr,p[N],c[N],rt[N],ans[N],pos[N];
char s[N];
struct SegTree{
	int cnt,w[N<<5],ls[N<<5],rs[N<<5];
	int Change(int x,int L,int R,int pos){
		int p=++cnt;w[p]=max(w[x],pos);
		if(L==R)return p;int mid=(L+R)>>1;
		if(pos<=mid)ls[p]=Change(ls[x],L,mid,pos),rs[p]=rs[x];
		else rs[p]=Change(rs[x],mid+1,R,pos),ls[p]=ls[x];
		return p;
	}
	int Ask(int x,int L,int R,int l,int r){
		if(!x)return 0;
		if(L==l&&R==r)return w[x];
		int mid=(L+R)>>1;
		if(r<=mid)return Ask(ls[x],L,mid,l,r);
		if(l>mid)return Ask(rs[x],mid+1,R,l,r);
		return max(Ask(ls[x],L,mid,l,mid),Ask(rs[x],mid+1,R,mid+1,r));
	}
	int Merge(int x,int y){
		if(!x||!y)return x+y;
		int p=++cnt;w[p]=max(w[x],w[y]);
		ls[p]=Merge(ls[x],ls[y]);
		rs[p]=Merge(rs[x],rs[y]);
		return p;
	}
}R;
struct SAM{
	int cnt,last,ch[N][26],len[N],fa[N];
	void init(){
		memset(ch[1],0,sizeof(ch[1]));
		last=cnt=1;
	}
	int Insert(int c){
		int p=last,np=last=++cnt;
		len[np]=len[p]+1;
		memset(ch[np],0,sizeof(ch[np]));
		for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np;
		if(!p)fa[np]=1;
		else{
			int q=ch[p][c];
			if(len[p]+1==len[q])fa[np]=q;
			else{
				int nq=++cnt;len[nq]=len[p]+1;
				memcpy(ch[nq],ch[q],sizeof(ch[nq]));
				fa[nq]=fa[q];fa[q]=fa[np]=nq;pos[nq]=pos[q];
				for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;
			}
		}
		last=np;return np;
	}
	void Build(){
		for(int i=1;i<=cnt;i++)c[len[i]]++;
		for(int i=1;i<=n;i++)c[i]+=c[i-1];
		for(int i=1;i<=cnt;i++)p[c[len[i]]--]=i;
		for(int i=cnt;i>=1;i--){
			int x=p[i];
			rt[fa[x]]=R.Merge(rt[fa[x]],rt[x]);
		}
		return;
	}
	void next(int &x,int &l,int c){
		while(x){
			if(ch[x][c]){
				int maxl=R.Ask(rt[ch[x][c]],1,n,1,qr)-ql+1;
				if(len[fa[x]]<maxl){l=min(l+1,maxl);x=ch[x][c];return;}
			}
			x=fa[x];l=len[x];
		}
		l=0;x=1;return;
	}
	ll calc(){
		ll prt=0;
		for(int i=2;i<=cnt;i++)
			prt+=max(len[i]-max(ans[pos[i]],len[fa[i]]),0);
		return prt;
	}
}S,T;
void work(char *s){
	int m=strlen(s+1);T.init();
	for(int i=1;i<=m;i++){
		int x=T.Insert(s[i]-'a');
		pos[x]=i;
	}
	int x=1,l=0;
	for(int i=1;i<=m;i++){
		int c=s[i]-'a';
		S.next(x,l,c);
		ans[i]=l;
	}
	printf("%lld\n",T.calc());
}
signed main()
{
	scanf("%s",s+1);n=strlen(s+1);
	S.init();
	for(int i=1;i<=n;i++){
		int x=S.Insert(s[i]-'a');
		rt[x]=R.Change(rt[x],1,n,i);
	}
	S.Build();
	scanf("%d",&q);
	while(q--){
		scanf("%s",s+1);
		scanf("%d%d",&ql,&qr);
		work(s);
	}
	return 0;
}
原文地址:https://www.cnblogs.com/QuantAsk/p/14454903.html