Codeforces 235 C(后缀自动机)

传送门

题意:

给你一个主串strstr以及nn个模式串。问你这nn个模式串的所有循环同构在主串strstr中的出现次数。

题目分析:

这是一个需要转换思维的题目。

首先,如果题目中不要求我们求每一个模式串的循环同构的出现此时,显然这道题我们直接可以用后缀自动机进行求解。而现在的问题就是我们应当如何在比较优的时间内将一个字符串中的所有循环同构的出现次数。

我们首先对主串建立后缀自动机。

其次,我们考虑将模式串strstr复制并接在原串后面,形成一个新串strstrstrstr,这样,新串中的每一个长度等于str|str|的子串都可以表示为串strstr的其中一个循环同构子串。此时,我们发现,如果我们用新串strstrstrstr在后缀自动机上匹配,匹配到的每个长度为str|str|的子串出现次数之和即为答案。因此,在我们在后缀自动机上对strstrstrstr串进行匹配的过程中,我们只需要记录一下当前成功匹配的长度。倘若当前成功匹配的长度大于str|str|,则我们只需要在parentparent树上跳转,直到出现一个状态stist_i,使得len[sti]+1strlen[st_i]+1le|str|,此时我们只需要把该状态stist_i所对应的所有子串的出现次数endpos(sti)|endpos(st_i)|累加到答案即可。

而某状态stist_i所对应的所有子串的出现次数endpos(sti)|endpos(st_i)|,我们可以用拓扑排序在建立自动机的过程中预处理出来。

PS:后缀自动机要开双倍/四倍空间,否则会疯狂RE

代码:

#include <bits/stdc++.h>
using namespace std;
const int maxn = 1000000;
char str[maxn];
int n,ans[maxn];
struct SAM{
    int next[maxn*2][26],fa[maxn*2],l[maxn*2];
    int last,cnt=0;
    int cntA[maxn*2],A[maxn*2];
    int num[maxn*2];
    SAM(){clear();}
    void clear(){
        last=cnt=1;
        fa[1]=l[1]=0;
        memset(next[1],0,sizeof(next[1]));
    }
    void init(char *s){
        while(*s){
            Insert(*s-'a');
            s++;
        }
    }
    void Insert(int c){
        int p=last;
        int np=++cnt;
        num[np]=1;
        memset(next[cnt],0,sizeof(next[cnt]));
        l[np]=l[p]+1;
        last=np;
        while(p&&!next[p][c]) next[p][c]=np,p=fa[p];
        if(!p) fa[np]=1;
        else{
            int q=next[p][c];
            if(l[q]==l[p]+1) fa[np]=q;
            else{
                int nq=++cnt;
                l[nq]=l[p]+1;
                memcpy(next[nq],next[q],sizeof next[nq]);
                fa[nq]=fa[q];
                while(next[p][c]==q) next[p][c]=nq,p=fa[p];
                fa[np]=fa[q]=nq;
            }
        }
    }
    void build(char *s){
        memset(cntA,0,sizeof(cntA));
        memset(A,0,sizeof(A));
        int len=strlen(s);
        for(int i=1;i<=cnt;i++) cntA[l[i]]++;
        for(int i=1;i<=cnt;i++) cntA[i]+=cntA[i-1];
        for(int i=cnt;i>=1;i--) A[cntA[l[i]]--] =i;
        int tmp=1;
        for(int i=cnt;i>=1;i--){
            int x=A[i];
            num[fa[x]]+=num[x];
        }
    }
    void query(int len,int id){
        int now=1,ans=0,L=0;
        int vis[maxn<<1];
        for(int i=1;i<=len+len;i++){
            int x=str[i]-'a';
            if(next[now][x]) L++,now=next[now][x];
            else{
                while(now&&!next[now][x]) now=fa[now];
                if(!now) now=1,L=0;
                else L=l[now]+1,now=next[now][x];
            }
            if(i>len&&L>=len){
                int tmp=now;
                while(tmp&&!(l[fa[tmp]]+1<=len&&l[tmp]>=len)) tmp=fa[tmp];
                if(!tmp) tmp=1;
                if(vis[tmp]!=id) ans+=num[tmp],vis[tmp]=id;
            }
        }
        printf("%d
",ans);
    }
}sam;
int main()
{
    //freopen("in.txt","r",stdin);
    scanf("%s",str);
    sam.clear();
    sam.init(str);
    sam.build(str);
    int n;
    scanf("%d",&n);
    for(int i=1;i<=n;i++){
        scanf("%s",str+1);
        int len=strlen(str+1);
        for(int i=1;i<=len;i++){
            str[i+len]=str[i];
        }
        sam.query(len,i);
    }
}

原文地址:https://www.cnblogs.com/Chen-Jr/p/11007158.html