【怪物】KMP畸形变种——扩展KMP

问题

参考51nod1304这道题;
很显然我们要求的是S的每个后缀与S的最长公共前缀的长度之和。

暴力

假设我们把next[i]表示为第i个后缀与S的最长公共前缀的长度。
现在我们想了:这个next数组,如果暴力来求的话,时间复杂度是O(n2)
这是我们回忆一下KMP:KMP物尽其用,然后呢就把求fail的速度提高到了O(n)
那么我们在求next数组的时候,可不可以也使用这样的想法来物尽其用,尽可能地去除重复的匹配呢?
答案是肯定的。

引入扩展KMP


假设要处理出S的next数组,现在已经处理出前s的next了。
现在要求出下一个位置x的next。
其中维护一个li,使得li=max{next[id]}(id[1,s])


由next[id]的定义,我们知道S[id..li]=S[1..next[id]]
推得S[x..li]=S[1+xid..next[id]]
如果id>1,那么1+xid<x,进一步next[1+xid]我们已经是知道的了。
于是就有S[x..li]=S[1..next[1+xid]]


目前为止,我们很容易看出,x往后的next[1+xid]这一段是可以不用匹配的。
但我们需要再分类一下:

1.x+next[1+x-id]-1<li

这种情况显然是next[x]=next[1+xid]
因为在li范围内,next[1+xid]是极大的。
所以next[x]不会比next[1+xid]更大。

2.x+next[1+x-id]-1>=li

这种情况虽然我们可以知道,[x,li]这一段是可以不用匹配的。
但是li以后的情况我们都是未知的。
那么我们暴力匹配来推进li。
于是乎就会有新的li=next[x],id=x


重复上述过程,我们可以求出所有的next。
显然时间复杂度只与li的推进有关,即为O(n)

回到本题

使用扩展KMP求出next后,求和即可。
我的博客

扩展KMP的完全体

事实上本题只是扩展KMP的退化。
扩展KMP可以用于求一个串S的所有后缀与目标串T的最长公共前缀的的长度。
想法与求next数组一样。


设要求的东西叫ext。

其中维护一个li,使得li=max{ext[id]}(id[1,s])
同理推得S[x..li]=T[1..next[1+xid]],其中next关于T。
那么依然分类讨论,即可求出ext。

最后贴上一个求next的程序

#include<iostream>
#include<stdio.h>
#include<math.h>
#include<string.h>
#include<algorithm>
#define ll long long
using namespace std;
const char* fin="ex1304.in";
const char* fout="ex1304.out";
const int inf=0x7fffffff;
const int maxn=1000007;
int n,i,j,k,limit,id;
ll ans;
char a[maxn];
int ne[maxn];
int main(){
    scanf("%s",a+1);
    n=strlen(a+1);
    limit=0;
    id=0;
    ne[1]=n;
    for (i=2;i<=n;i++){
        j=ne[i-id+1];
        if (i+j-1<limit) ne[i]=j;
        else{
            j=max(0,limit-i+1);
            for (;j+i<=n;j++) if (a[i+j]!=a[j+1]) break;
            if (i+j-1>limit){
                limit=i+j-1;
                id=i;
            }
            ne[i]=j;
        }
    }
    for (i=1;i<=n;i++) ans+=ne[i];
    printf("%lld",ans);
    return 0;
}
原文地址:https://www.cnblogs.com/hiweibolu/p/6714821.html