[日常摸鱼]字符串相关

最近开始学字符串…之前暑假听JOHNKROM大爷讲这个的时候就很懵(当时根本没碰过这个东西…)

这里大概会有一些相关的算法和自己做的题,还有存一些模板啥的。

由于我太弱了所以可能不会写有关原理的东西(或者等我哪天会了有空再补)如果是刚学的话还是去网上找教程吧…我就存个题还有模板啥的orz


Trie
字典树(Trie),根节点为空节点,其他节点(或边上)放字母,然后节点上还能储存一些其他信息。

1.一个类似模板题的东西:luogu2580

建一颗Trie,把所有名字插进去,结束的地方打个标记,具体见代码

#include<cstdio>
#include<cstring>
const int N=500005;
int n,m,cnt;
int tr[N][30],s[N];
char temp[55];

inline void insert(char *c)
{
    int now=0,len=strlen(c+1);
    for(register int i=1;i<=len;i++)
    {
        int k=c[i]-'a';
        if(tr[now][k]==0)tr[now][k]=++cnt;
        now=tr[now][k];
    }s[now]=1;
}
inline int access(char *c)
{
    int now=0,len=strlen(c+1);
    for(register int i=1;i<=len;i++)
    {
        int k=c[i]-'a';
        if(tr[now][k]==0)return -1;
        now=tr[now][k];
    }
    if(s[now]==1)
    {
        s[now]++;
        return 1;
    }else if(s[now]>1)
        return 0;
    return -1;
}
int main()
{
    scanf("%d",&n);
    for(register int i=1;i<=n;i++)
    {
        scanf("%s",temp+1);
        insert(temp); 
    }
    scanf("%d",&m);
    for(register int i=1;i<=m;i++)
    {
        scanf("%s",temp+1);
        int res=access(temp);
        if(res==-1)printf("WRONG
");
        else if(res==0)printf("REPEAT
");
        else printf("OK
");
    }
    return 0;
}
View Code

KMP

用来在线性时间完成单个文本和模式串匹配的算法,通过一个$next$数组来优化朴素算法

(一篇看到感觉比较好的blog:http://blog.csdn.net/joylnwang/article/details/6778316/

1.模板题:luogu3375

#include<cstdio>
#include<cstring>
const int N=1000005;
char s[N],t[N];
int n,m,nxt[N];
int main()
{
    scanf("%s%s",s+1,t+1);
    n=strlen(s+1);m=strlen(t+1);
    nxt[1]=0;
    for(register int i=2,j=0;i<=m;i++)
    {
        while(j&&t[i]!=t[j+1])j=nxt[j];
        if(t[i]==t[j+1])j++;
        nxt[i]=j;
    }
    for(register int i=1,j=0;i<=n;i++)
    {
        while(j&&t[j+1]!=s[i])j=nxt[j];
        if(s[i]==t[j+1])j++;
        if(j==m)
        {
            j=nxt[j];
            printf("%d
",i-m+1); 
        }
    }
    for(register int i=1;i<=m;i++)printf("%d ",nxt[i]);
}
View Code

2.找最小循环节:poj2406

题意:求最大的$n$使得给定的$s=a^n$,$a$为某个字符串($a^n$就是$n$个$a$拼在一起)

要让$n$最大那就要让$|a|$最小,所以就是要找最小循环节的长度,注意到KMP求出来的$next[i]$的意义是从开头到$i$的子串里前缀和后缀相等的最长的长度,那么$n-next[n]$就是要求最小循环节辣!然后如果求出来的长度不能被$|s|$整除那答案就是1

#include<cstdio>
#include<cstring>
const int N=1000005;
int n,temp,ans,nxt[N];
char s[N];
int main()
{
    while(1)
    {
        memset(nxt,0,sizeof(nxt));
        scanf("%s",s+1);if(s[1]=='.')break;
        n=strlen(s+1);nxt[1]=0;int i,j;ans=0;
        for(i=2,j=0;i<=n;i++)
        {
            while(j&&s[j+1]!=s[i])j=nxt[j];
            if(s[j+1]==s[i])j++;
            nxt[i]=j;
        }
        temp=n-nxt[n];
        if(n%temp==0)ans=n/temp;
        else ans=1;
        printf("%d
",ans);
    }
    return 0;
}
View Code

3.HDU1358

类似上一题

这两个应该都算kmp相关的经典问题吧x

#include<cstdio>
#include<cstring>
const int N=1000005;
char s[N];
int n,k,temp,nxt[N];
int main()
{
    while(scanf("%d",&n)==1&&n)
    {
        printf("Test case #%d
",++k);
        scanf("%s",s+1);nxt[1]=0;
        for(register int i=2,j=0;i<=n;i++)
        {
            while(j&&s[j+1]!=s[i])j=nxt[j];
            if(s[j+1]==s[i])j++;
            nxt[i]=j;
        }
        for(register int i=2;i<=n;i++)
        {
            temp=i-nxt[i];
            if(i%temp==0&&i>temp)printf("%d %d
",i,i/temp);
        }printf("
");
    }
    return 0;
}
View Code

Manacher

求一个字符串的最长回文子串

1. 模板题:luogu3805

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=25000005;
int n,ans,p[N];
char s[N],str[N];
inline void manacher()
{
    int mx=0,pos=0;
    for(register int i=n;str[i]!=0;i++)str[i]=0;
    for(register int i=1;i<n;i++)
    {
        if(mx>i)p[i]=min(p[2*pos-i],p[pos]+pos-i);
        else p[i]=1;
        for(;str[i+p[i]]==str[i-p[i]];++p[i]);
        if(p[i]+i>mx){mx=p[i]+i;pos=i;}
    }
}
inline void init()
{
    str[0]=str[1]='#';
    for(register int i=0;i<n;i++)str[(i<<1)+2]=s[i],str[(i<<1)+3]='#';
    n=(n<<1)+2;str[n]=0;
}
int main()
{
    scanf("%s",s);
    n=strlen(s);init();manacher();
    for(register int i=0;i<n;i++)ans=max(ans,p[i]);
    printf("%d",ans-1); 
}
View Code

AC自动机

Aho-Corasick自动机,一个文本串和多个模式串进行匹配

1.模板题:luogu3808

#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int N=1000005;
const int S=26;
char s[N];
int n;
queue<int>q;
struct ac_automation
{
    int cnt;
    int tr[N][S+3],fail[N],val[N];
    inline void insert(char *c)
    {
        int len=strlen(c+1),k=0;
        for(register int i=1;i<=len;i++)
        {
            int t=c[i]-'a';
            if(!tr[k][t])tr[k][t]=++cnt;
            k=tr[k][t];
        }val[k]++;
    }
    inline void build()
    {
        for(register int i=0;i<S;i++)if(tr[0][i])fail[tr[0][i]]=0,q.push(tr[0][i]);
        while(!q.empty())
        {
            int k=q.front();q.pop();
            for(register int i=0;i<S;i++)
            {
                if(tr[k][i])q.push(tr[k][i]),fail[tr[k][i]]=tr[fail[k]][i];
                else tr[k][i]=tr[fail[k]][i];
            }
        }
    }
    inline int solve(char *c)
    {
        int len=strlen(c+1),k=0,ans=0;
        for(register int i=1;i<=len;i++)
        {
            k=tr[k][c[i]-'a'];
            for(register int j=k;j&&~val[j];j=fail[j])ans+=val[j],val[j]=-1;
        }return ans;
    }
}ac;
int main()
{
    scanf("%d",&n);
    for(register int i=1;i<=n;i++)scanf("%s",s+1),ac.insert(s);
    ac.build();scanf("%s",s+1);printf("%d",ac.solve(s));
    return 0;
}
View Code

我好像也只会模板了orz

2.需要统计次数的luogu3796 / uvalive4670

T_T我好像只会写而已…

#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int N=1000005;
const int S=26;
char s[N],str[155][75];
int n,mark[N];
queue<int>q;
struct ac_automation
{
    int cnt;
    int tr[N][S+3],fail[N],val[N],last[N];
    inline void init()
    {
        for(register int i=0;i<=cnt;i++)
        {
            memset(tr[i],0,sizeof(tr[i]));
            fail[i]=val[i]=last[i]=mark[i]=0;
        }
        for(register int i=1;i<=n;i++)memset(str[i],0,sizeof(str[i]));
        cnt=n=0;
    }
    inline void insert(char *c,int p)
    {
        int len=strlen(c+1),k=0;
        for(register int i=1;i<=len;i++)
        {
            int t=c[i]-'a';
            if(!tr[k][t])tr[k][t]=++cnt;
            k=tr[k][t];
        }
        val[k]=p;
    }
    inline void build()
    {
        while(!q.empty())q.pop();
        for(register int i=0;i<S;i++)if(tr[0][i])q.push(tr[0][i]);
        while(!q.empty())
        {
            int k=q.front();q.pop();
            for(register int i=0;i<S;i++)
            {
                if(tr[k][i])
                {
                    int v=tr[k][i];
                    fail[tr[k][i]]=tr[fail[k]][i];
                    last[v]=(val[fail[v]]?fail[v]:last[fail[v]]);
                    q.push(tr[k][i]);
                }
                else tr[k][i]=tr[fail[k]][i];
            }
        }
    }
    inline void solve(char *c)
    {
        int len=strlen(c+1),mx=0,k=0;
        for(register int i=1;i<=len;i++)
        {
            k=tr[k][c[i]-'a'];
            if(val[k])mark[val[k]]++;
            int t=last[k];
            while(t)
            {
                if(val[t])mark[val[t]]++;
                t=last[t]; 
            }
        }
        for(register int i=1;i<=n;i++)mx=max(mx,mark[i]);printf("%d
",mx); 
        for(register int i=1;i<=n;i++)if(mark[i]==mx)printf("%s
",str[i]+1);
    }
}ac;
int main()
{
    while(scanf("%d",&n)==1)
    {
        if(n==0)break;
        for(register int i=1;i<=n;i++)scanf("%s",str[i]+1),ac.insert(str[i],i);
        ac.build();scanf("%s",s+1);ac.solve(s);ac.init();
    }
    return 0;
}
View Code

to be continued

原文地址:https://www.cnblogs.com/yoshinow2001/p/8075644.html