扩展KMP模板

扩展KMP指的是

对于给出的串S和T,以O(n)的时间求出。

对于所有0<=i<len(S),S(i,i+1,...,len(s)-1)与T的最长前缀长度。

next[i]为满足B[i..i+z-1]==B[0..z-1]的最大的z值。

以下是模板:

#include <iostream>
#include <string>
#include <stdio.h>
#include <string.h>
using namespace std;

const int MM=100005;
int mynext[MM],extand[MM];
char S[MM],T[MM];
void Getmynext(const char *T){
    int len=strlen(T),a=0;
    mynext[0]=len;
    while(a<len-1 && T[a]==T[a+1]) a++;
    mynext[1]=a;
    a=1;
    for(int k=2;k<len;k++){
        int p=a+mynext[a]-1,L=mynext[k-a];
        if( (k-1)+L >= p){
            int j = (p-k+1)>0 ? (p-k+1) : 0;
            while(k+j<len && T[k+j]==T[j]) j++;
            mynext[k]=j;
            a=k;
        }
        else
            mynext[k]=L;
    }
}
void GetExtand(const char *S,const char *T){
    Getmynext(T);
    int slen=strlen(S),tlen=strlen(T),a=0;
    int MinLen = slen < tlen ? slen : tlen;
    while(a<MinLen && S[a]==T[a]) a++;
    extand[0]=a;
    a=0;
    for(int k=1;k<slen;k++){
        int p=a+extand[a]-1, L=mynext[k-a];
        if( (k-1)+L >= p){
            int j= (p-k+1) > 0 ? (p-k+1) : 0;
            while(k+j<slen && j<tlen && S[k+j]==T[j]) j++;
            extand[k]=j;
            a=k;
        }
        else
            extand[k]=L;
    }
}
int main(){
    int tt;
    cin>>tt;
    while(tt--)
    {
        scanf("%s%s",S,T);
        GetExtand(S,T);
        //接下来用mynext 和 extand 即可.
    }
    return 0;
}

下面举一个例子,S=”aaaabaa”,T=”aaaaa”,首先,计算extend[0]时,需要进行5次匹配,直到发生失配。

从而得知extend[0]=4,下面计算extend[1],在计算extend[1]时,是否还需要像计算extend[0]时从头开始匹配呢?答案是否定的,因为通过计算extend[0]=4,从而可以得出S[0,3]=T[0,3],进一步可以得到 S[1,3]=T[1,3],计算extend[1]时,事实上是从S[1]开始匹配,设辅助数组next[i]表示T[i,m-1]和T的最长公共前缀长度。在这个例子中,next[1]=4,即T[0,3]=T[1,4],进一步得到T[1,3]=T[0,2],所以S[1,3]=T[0,2],所以在计算extend[1]时,通过extend[0]的计算,已经知道S[1,3]=T[0,2],所以前面3个字符已经不需要匹配,直接匹配S[4]和T[3]即可,这时一次就发生失配,所以extend[1]=3。

另带一张自己理解的图:

原文地址:https://www.cnblogs.com/chenhuan001/p/5240667.html