【怪物】KMP畸形变种——扩展KMP

问题

参考51nod1304这道题；
很显然我们要求的是S的每个后缀与S的最长公共前缀的长度之和。

暴力

假设我们把next[i]表示为第i个后缀与S的最长公共前缀的长度。
现在我们想了：这个next数组，如果暴力来求的话，时间复杂度是O(n2)。
这是我们回忆一下KMP：KMP物尽其用，然后呢就把求fail的速度提高到了O(n)。
那么我们在求next数组的时候，可不可以也使用这样的想法来物尽其用，尽可能地去除重复的匹配呢？
答案是肯定的。

引入扩展KMP

假设要处理出S的next数组，现在已经处理出前s的next了。
现在要求出下一个位置x的next。
其中维护一个li，使得li=max{next[id]}(id∈[1,s])。

由next[id]的定义，我们知道S[id..li]=S[1..next[id]]。
推得S[x..li]=S[1+x−id..next[id]]。
如果id>1，那么1+x−id<x，进一步next[1+x−id]我们已经是知道的了。
于是就有S[x..li]=S[1..next[1+x−id]]。

目前为止，我们很容易看出，x往后的next[1+x−id]这一段是可以不用匹配的。
但我们需要再分类一下：

1.x+next[1+x-id]-1<li

这种情况显然是next[x]=next[1+x−id]。
因为在li范围内，next[1+x−id]是极大的。
所以next[x]不会比next[1+x−id]更大。

2.x+next[1+x-id]-1>=li

这种情况虽然我们可以知道，[x,li]这一段是可以不用匹配的。
但是li以后的情况我们都是未知的。
那么我们暴力匹配来推进li。
于是乎就会有新的li=next[x],id=x。

重复上述过程，我们可以求出所有的next。
显然时间复杂度只与li的推进有关，即为O(n)。

回到本题

使用扩展KMP求出next后，求和即可。
我的博客。

扩展KMP的完全体

事实上本题只是扩展KMP的退化。
扩展KMP可以用于求一个串S的所有后缀与目标串T的最长公共前缀的的长度。
想法与求next数组一样。

设要求的东西叫ext。

其中维护一个li，使得li=max{ext[id]}(id∈[1,s])。
同理推得S[x..li]=T[1..next[1+x−id]]，其中next关于T。
那么依然分类讨论，即可求出ext。

最后贴上一个求next的程序

#include<iostream>
#include<stdio.h>
#include<math.h>
#include<string.h>
#include<algorithm>
#define ll long long
using namespace std;
const char* fin="ex1304.in";
const char* fout="ex1304.out";
const int inf=0x7fffffff;
const int maxn=1000007;
int n,i,j,k,limit,id;
ll ans;
char a[maxn];
int ne[maxn];
int main(){
    scanf("%s",a+1);
    n=strlen(a+1);
    limit=0;
    id=0;
    ne[1]=n;
    for (i=2;i<=n;i++){
        j=ne[i-id+1];
        if (i+j-1<limit) ne[i]=j;
        else{
            j=max(0,limit-i+1);
            for (;j+i<=n;j++) if (a[i+j]!=a[j+1]) break;
            if (i+j-1>limit){
                limit=i+j-1;
                id=i;
            }
            ne[i]=j;
        }
    }
    for (i=1;i<=n;i++) ans+=ne[i];
    printf("%lld",ans);
    return 0;
}