洛谷P4770 [NOI2018]你的名字(后缀自动机+线段树)

传送门

我有种自己根本没学过SAM的感觉……最后还是抄了老半天的题解……

首先,对$S$和每一次的$T$都建一个SAM

先考虑一下$l=1,r=left| S ight|$的情况

设$lim_i$表示字符串$T[1..i]$能在$S$中匹配到的最长后缀(即$T[i-lim_i+1,i]$是$S$的子串且$lim_i$最大)(有可能不存在这个字符那么$lim_i=0$)

这个$lim_i$可以不断地在$S$的后缀自动机上跳来求出。当无法向下匹配时,一直跳parent树直到可以匹配为止

我们假设对于$T$的后缀自动机,每一个节点的$endpos$集合中所能代表的最长的字符串长度为$l_i$,$tag_i$表示该集合字符串第一次出现的结尾位置(因为集合里字符串互为后缀所以结尾相同),$fa_i$表示parent树上的父亲,$cnt$表示自动机节点总个数

那么答案就是$$ans=sum_{i=2}^{cnt}max(0,l_i-max(l_{fa_i},lim_{tag_i}))$$

ps:这里的lim指的并不是上文的lim而是最长后缀的长度

上面式子的意思是,对于每一个节点,它不属于$S$的子串的总个数为当前节点代表的集合字符串个数减去与$S$有匹配的子串个数

然后只要在$T$的后缀自动机上枚举每一个节点就可以了

现在来考虑$l$和$r$任意的情况该怎么做

这个时候就要用线段树维护后缀自动机的$endpos$集合了(不明白这个怎么做的我简单说一下,就是搞一个动态开点线段树,如果一个节点的$endpos$集合里有某一个位置就把它加入以该点为根的树中,parent树上父亲节点的$endpos$集合必然包含儿子的$endpos$集合所以将每个点的$endpos$集合与它儿子的合并。然后查询这个节点是否有$endpos$位于某个区间中只要在线段树上查询看看这个区间代表的节点是否被开出来过就好了(因为线段树上只有存在的位置的节点被开出来过))

我们在处理$lim_i$集合的时候要注意,要判断当前节点是否在$S[l..r]$区间中出现过。设$p$为当前在$S$的自动机上跑到的节点,$len$表示匹配了$[i-len+1..i]$,因为要看能否转移到下一个节点,所以要匹配$[i-len,i]$,且$[l+len,r]$中有后继节点的$endpos$存在才行(可能说的烦了点,仔细想想为什么)

差不多就这样

  1 //minamoto
  2 #include<iostream>
  3 #include<cstdio>
  4 #include<cstring>
  5 #include<algorithm>
  6 #define ll long long
  7 using namespace std;
  8 char sr[1<<21],z[20];int C=-1,Z;
  9 inline void Ot(){fwrite(sr,1,C+1,stdout),C=-1;}
 10 inline void print(ll x){
 11     if(C>1<<20)Ot();
 12     while(z[++Z]=x%10+48,x/=10);
 13     while(sr[++C]=z[Z],--Z);sr[++C]='
';
 14 }
 15 const int N=1e6+5,M=2e7+5,inf=0x3f3f3f3f;
 16 int q,n,m,rt[N],lim[N];char S[N];ll ans;
 17 namespace tree{
 18     int cnt,L[M],R[M];
 19     void ins(int &p,int l,int r,int x){
 20         if(!p) p=++cnt;
 21         if(l==r) return;
 22         int mid=(l+r)>>1;
 23         if(x<=mid) ins(L[p],l,mid,x);
 24         else ins(R[p],mid+1,r,x);
 25     }
 26     int merge(int x,int y){
 27         if(!x||!y) return x+y;
 28         int p=++cnt;
 29         L[p]=merge(L[x],L[y]);
 30         R[p]=merge(R[x],R[y]);
 31         return p;
 32     }
 33     bool query(int p,int l,int r,int ql,int qr){
 34         if(!p||ql>qr) return false;
 35         if(ql<=l&&qr>=r) return true;
 36         int mid=(l+r)>>1;
 37         if(ql<=mid&&query(L[p],l,mid,ql,qr)) return true;
 38         if(qr>mid&&query(R[p],mid+1,r,ql,qr)) return true;
 39         return false;
 40     }
 41 }
 42 namespace SAM{
 43     int cnt=1,last=1;
 44     int ch[N][26],l[N],fa[N],c[N],a[N],in[N];
 45     void ins(int c){
 46         int p=last,np=++cnt;last=np,l[np]=l[p]+1,in[np]=1;
 47         for(;p&&!ch[p][c];p=fa[p]) ch[p][c]=np;
 48         if(!p) fa[np]=1;
 49         else{
 50             int q=ch[p][c];
 51             if(l[q]==l[p]+1) fa[np]=q;
 52             else{
 53                 int nq=++cnt;l[nq]=l[p]+1;
 54                 memcpy(ch[nq],ch[q],sizeof(int)*(26));
 55                 fa[nq]=fa[q],fa[q]=fa[np]=nq;
 56                 for(;ch[p][c]==q;p=fa[p]) ch[p][c]=nq;
 57             }
 58         }
 59     }
 60     inline void calc(){
 61         for(int i=1;i<=n;++i) ins(S[i]-'a');
 62         for(int i=1;i<=cnt;++i) ++c[l[i]];
 63         for(int i=1;i<=cnt;++i) c[i]+=c[i-1];
 64         for(int i=1;i<=cnt;++i) a[c[l[i]]--]=i;
 65         for(int i=cnt,p;i;--i){
 66             p=a[i];
 67             if(in[p]) tree::ins(rt[p],1,n,l[p]);
 68             rt[fa[p]]=tree::merge(rt[fa[p]],rt[p]);
 69         }
 70     }
 71 }
 72 namespace solve{
 73     int cnt=1,last=1;
 74     int ch[N][26],l[N],fa[N],c[N],a[N],tag[N];
 75     inline void init(){
 76         cnt=last=1,memset(ch[1],0,sizeof(int)*(26));
 77     }
 78     inline int newnode(){
 79         ++cnt;memset(ch[cnt],0,sizeof(int)*(26));return cnt;
 80     }
 81     void ins(int c){
 82         int p=last,np=newnode();last=np,tag[np]=l[np]=l[p]+1;
 83         for(;p&&!ch[p][c];p=fa[p]) ch[p][c]=np;
 84         if(!p) fa[np]=1;
 85         else{
 86             int q=ch[p][c];
 87             if(l[q]==l[p]+1) fa[np]=q;
 88             else{
 89                 int nq=newnode();l[nq]=l[p]+1,tag[nq]=tag[q];
 90                 memcpy(ch[nq],ch[q],sizeof(int)*(26));
 91                 fa[nq]=fa[q],fa[q]=fa[np]=nq;
 92                 for(;ch[p][c]==q;p=fa[p]) ch[p][c]=nq;
 93             }
 94         }
 95     }
 96     ll solve(){
 97         int L,R;
 98         scanf("%s%d%d",S+1,&L,&R);
 99         init();
100         m=strlen(S+1);
101         for(int len=0,p=1,i=1;i<=m;++i){
102             int c=S[i]-'a';
103             ins(c);
104             while(true){
105                 if(SAM::ch[p][c]&&tree::query(rt[SAM::ch[p][c]],1,n,L+len,R)){
106                     ++len,p=SAM::ch[p][c];break;
107                 }
108                 if(len==0) break;
109                 --len;
110                 if(len==SAM::l[SAM::fa[p]]) p=SAM::fa[p];
111             }
112             lim[i]=len;
113         }
114         ans=0;
115         for(int i=2;i<=cnt;++i)
116         ans+=max(0,l[i]-max(l[fa[i]],lim[tag[i]]));
117         return ans;
118     }
119 }
120 int main(){
121 //    freopen("testdata.in","r",stdin);
122     scanf("%s",S+1);
123     n=strlen(S+1);
124     SAM::calc();
125     scanf("%d",&q);
126     while(q--) print(solve::solve());
127     Ot();
128     return 0;
129 }
原文地址:https://www.cnblogs.com/bztMinamoto/p/9682480.html