CF587F-Duff is Mad【AC自动机,根号分治】

正题

题目链接:https://www.luogu.com.cn/problem/CF587F


题目大意

给出(n)个字符串(s)(q)次询问给出(l,r,k)要求输出(s_{l..r})(s_k)中出现了多少次。

(1leq n,q,sum |s_i|leq 10^5)


解题思路

考虑一个比较暴力的做法,先把所有的构出一棵(AC)自动机,一个串(S)有后缀(T)当且仅当在(fail)树上(S)的节点在(T)的子树内。

所以暴力的做法就是统计(s_k)的节点有多少在(s_{l..r})的终止节点子树内的节点。

需要优化,因为有(L=sum |s_i|leq 10^5),所以可以考虑根号分治,设定值(T=sqrt{L})

对于长度大于(T)(k),我们所有的询问统一差分变为前缀问题处理。因为这样的串的个数不会超过(sqrt L)个,所以可以每次暴力(O(n))处理。

我们把所有(s_k)路径上的节点权值加一,然后暴力扫描(n)个串,每次终止节点统计子树内的权值和。

对于长度小于等于(T)(k),我们差分后按照询问端点排序,从左到右扫过(n)个串每次子树内的权值加一,然后每次暴力扫描(s_k)的所有节点统计权值就好了。
使用树状数组时间复杂度(O(nsqrt nlog n)),已经可以通过本题了。但是如果把树状数组改成分块就可以平衡到(O(nsqrt n)),但是我懒


code

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<vector>
#include<queue>
#include<cmath>
#define ll long long
#define mp(x,y) make_pair(x,y)
#define lowbit(x) (x&-x)
using namespace std;
const ll N=1e5+10;
struct node{
	ll to,next;
}a[N];
ll n,m,T,tot,dfr,L,top[N],ls[N],l[N],t[N],ans[N];
ll cnt,ch[N][26],fail[N],pos[N],rfn[N],ed[N];
vector<pair<ll,ll> > v[N],V[N];
char *s[N],st[N];queue<ll> q;
void Change(ll x,ll val){
	while(x<=dfr){
		t[x]+=val;
		x+=lowbit(x);
	}
	return;
}
ll Ask(ll x){
	ll ans=0;
	while(x){
		ans+=t[x];
		x-=lowbit(x);
	}
	return ans;
}
void addl(ll x,ll y){
	a[++tot].to=y;
	a[tot].next=ls[x];
	ls[x]=tot;return;
}
ll Insert(char *s,ll l){
	ll x=0;
	for(ll i=0;i<l;i++){
		ll c=s[i]-'a';
		if(!ch[x][c])ch[x][c]=++cnt;
		x=ch[x][c];
	}
	return x;
}
void GetFail(){
	for(ll i=0;i<26;i++)
		if(ch[0][i])q.push(ch[0][i]);
	while(!q.empty()){
		ll x=q.front();q.pop();
		for(ll i=0;i<26;i++){
			if(!ch[x][i])ch[x][i]=ch[fail[x]][i];
			else{
				fail[ch[x][i]]=ch[fail[x]][i];
				q.push(ch[x][i]);
			}
		}
	}
	for(ll i=1;i<=cnt;i++)addl(fail[i],i);
	return;
}
void dfs(ll x,ll fa){
	rfn[x]=++dfr;
	for(ll i=ls[x];i;i=a[i].next){
		ll y=a[i].to;
		if(y==fa)continue;
		dfs(y,x);
	}
	ed[x]=dfr;
	return;
}
signed main()
{
	scanf("%lld%lld",&n,&m);
	for(ll i=1;i<=n;i++){
		s[i]=st+top[i];
		scanf("%s",s[i]);l[i]=strlen(s[i]);
		top[i+1]=top[i]+l[i];pos[i]=Insert(s[i],l[i]);
	}
	L=top[n+1];T=sqrt(L);
	GetFail();
	dfs(0,0);
	for(ll i=1;i<=m;i++){
		ll L,R,K;scanf("%lld%lld%lld",&L,&R,&K);
		if(l[K]<=T)v[R].push_back(mp(K,i)),v[L-1].push_back(mp(K,-i));
		else V[K].push_back(mp(R,i)),V[K].push_back(mp(L-1,-i));
	}
	for(ll p=1;p<=n;p++)
		if(l[p]>T){
			memset(t,0,sizeof(t));
			sort(V[p].begin(),V[p].end());
			ll x=0;
			for(ll i=0;i<l[p];i++){
				x=ch[x][s[p][i]-'a'];
				Change(rfn[x],1);
			}
			ll z=0,sum=0;
			while(z<V[p].size()&&!V[p][z].first)z++;
			for(ll i=1;i<=n;i++){
				sum+=Ask(ed[pos[i]])-Ask(rfn[pos[i]]-1);
				while(z<V[p].size()&&V[p][z].first<=i){
					ll id=V[p][z].second,op=1;
					if(id<0)id=-id,op=-op;
					ans[id]+=sum*op;z++;
				}
			}
		}
	memset(t,0,sizeof(t));
	for(ll p=1;p<=n;p++){
		Change(rfn[pos[p]],1);
		Change(ed[pos[p]]+1,-1);
		for(ll i=0;i<v[p].size();i++){
			ll k=v[p][i].first,id=v[p][i].second,op=1;
			if(id<0)id=-id,op=-op;ll x=0;
			for(ll j=0;j<l[k];j++){
				x=ch[x][s[k][j]-'a'];
				ans[id]+=op*Ask(rfn[x]);
			}
		}
	}
	for(ll i=1;i<=m;i++)
		printf("%lld
",ans[i]);
	return 0;
}
原文地址:https://www.cnblogs.com/QuantAsk/p/15028597.html