[JZOJ3337] 【NOI2013模拟】wyl8899的TLE

题目

题目大意

给你两个字符串(A)和(B)，可以修改(A)中的一个字符，求修改后最长的(A)的前缀，使它是(B)的子串。

思考历程

看到这道题之后，第一眼想到的就是后缀自动机！
(B)的子串，意味着可以把(B)建立一个后缀自动机，然后在上面跑……
刚开始的想法是将(A)在上面跑，并且试着修改后面一个字符，看看剩下的可以跑多长……
于是问题就转化成求这样的一个东西：问(A)的某个后缀从后缀自动机上的某个节点开始最多能跑多远。
我试着将这个东西预处理出来……可是没有成功……
交了个错误的程序上去，居然还有点分。

水法

这题不得不开“水法”这一栏目。
题目的数据真是太水了，各种暴力都能过。
最简单的暴力：枚举子串的左端点，然后暴力匹配，遇见的第一个不同就用掉修改机会，求出匹配的最大长度。
还有一种(O(n))的正确性显然错误的DP……
跑得都比正解快……

正解

有个exkmp的方法，虽然说时间可能会有点玄学，但既然是郑姐讲的方法，就把它归为“正解”这一栏吧……
求出(A)的(next)，以(A)为模式串求出(B)的(extend)。
枚举子串的开头(i)，则后面相同的子串长度为(extend_i)。
后面那个位置用修改操作，所以要从(A_{extend_i+2})和(B_{i+extend_i+1})开始继续匹配。
接下来取(min(next_{extend_i+2},extend_{i+extend_i+1}))。后面这个长度的串一定是相同的，因为前者等于(A)前面一段，后者也等于(A)前面一段，其中的最小值就是它们相等的长度。
然而这可能不是极限，所以后面的，就暴力判断吧……
时间应该比较优秀，虽然说那一部分暴力判断有点玄学……

然后是题解中的(LCP)做法。
先枚举子串的左端点(i)，求(LCP(B_{i..m},A))，设为(x)。(x+1)位可以用修改机会，然后求(LCP(A_{x+2..n},B_{i+x+1..m}))，就是后面能继续延伸的长度。
当然，记得判断一下到达边界的情况。
至于求(LCP)，最典型的做法是用后缀数组，将(A)和(B)并在一起，中间用特殊字符隔开，然后求后缀数组和(height)数组，然后用数据结构维护区间(height)最小值。
还有一种做法是用后缀自动机。考虑利用(fail)指针，如果跳两个节点在(fail)树上的(LCA)，它的(len)就是它们的最长公共后缀。要求最长公共前缀，就把字符串倒过来建后缀自动机就行了……（(fail)树实际上是逆序字符串的后缀树）这是两个字符串，所以要建广义后缀自动机。

最后是许多人使用的二分和(hash)做法。
首先二分答案(k)，将(B)串中长度为(k)的子串存入(hash)表。
然后(26n)来枚举修改的方案，每次修改后再(hash)表中查询。

代码

后缀自动机的做法……

using namespace std;
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cassert>
#define N 50010
int n,m;
char a[N],b[N];
struct Node{
	Node *c[26],*fail;
	int len;
} d[N*4];
int cnt;
Node *S,*last;
inline void insert(int ch){
	if (last->c[ch] && last->c[ch]->len==last->len+1){
		last=last->c[ch];
		return;
	}
	Node *nw=&d[++cnt],*p;
	nw->len=last->len+1;
	for (p=last;p && !p->c[ch];p=p->fail)
		p->c[ch]=nw;
	if (!p)
		nw->fail=S;
	else{
		Node *q=p->c[ch];
		if (p->len+1==q->len)
			nw->fail=q;
		else{
			Node *clone=&d[++cnt];
			memcpy(clone,q,sizeof(Node));
			clone->len=p->len+1;
			for (;p && p->c[ch]==q;p=p->fail)
				p->c[ch]=clone;
			nw->fail=q->fail=clone;
		}
	}
	last=nw;
}
int sta[N],stb[N];
int fa[N*4][17],dep[N*4];
int get_dep(int x){
	if (dep[x])
		return dep[x];
	if (!fa[x][0])
		return dep[x]=1;
	return dep[x]=get_dep(fa[x][0])+1;
}
int LCP(int u,int v){
	if (dep[u]<dep[v])
		swap(u,v);
	for (int k=dep[u]-dep[v],i=0;k;k>>=1,++i)
		if (k&1)
			u=fa[u][i];
	if (u==v)
		return d[u].len;
	for (int i=16;i>=0;--i)
		if (fa[u][i]!=fa[v][i])
			u=fa[u][i],v=fa[v][i];
	return d[fa[u][0]].len;
}
int main(){
	scanf("%s%s",a+1,b+1);
	n=strlen(a+1),m=strlen(b+1);
	n=min(n,m);
	last=S=&d[++cnt];
	for (int i=m;i>=1;--i){
		insert(b[i]-'a');
		stb[i]=last-d;
	}
	last=S;
	for (int i=n;i>=1;--i){
		insert(a[i]-'a');
		sta[i]=last-d;
	}
	fa[1][0]=0;
	for (int i=2;i<=cnt;++i)
		fa[i][0]=d[i].fail-d;
	for (int i=1;i<=cnt;++i)
		get_dep(i);
	for (int i=1;i<=16;++i)
		for (int j=1;j<=cnt;++j)
			fa[j][i]=fa[fa[j][i-1]][i-1];
	int ans=0;
	for (int i=1;i<=m;++i){
		int lcp=LCP(stb[i],sta[1]);
		if (lcp==n || lcp==n-1){
			printf("%d
",n);
			return 0;
		}
		ans=max(ans,lcp+(i+lcp<=m?1:0)+(i+lcp+1<=m?LCP(stb[i+lcp+1],sta[1+lcp+1]):0));
	}
	printf("%d
",ans);
	return 0;
}

总结

这题应该算是一道套路题吧……
所以看题的时候，不要试着死磕一个地方，要多方面地去考虑……
比如，枚举左端点右端点什么的……