@codeforces


@description@

给定一个长度为 n 的串 w,找到一个长度最长的字符串序列 (s_1, s_2, ..., s_k),使得 (s_1) 为 w 的子串且 (s_i)(s_{i-1}) 中出现了两次以上。

1 ≤ n ≤ 200 000。

原题戳这里

@solution@

首先可以得到 (s_{1...k}) 应该呈后缀关系。
否则,假如 (s_i)(s_{i+1}) 不为后缀,可以把 (s_i) 最右边的字符删去依然合法。
虽然同理可以得到它们还应该呈前缀关系,不过反而让问题复杂化了。

朴素的想法:设计 dp[l...r] 表示以 w[l...r] 为 (s_1) 的最长长度。
找到它最长的且在 w[l...r] 中出现了至少两次的后缀 w[p...r],则应有 dp[l...r] = dp[p...r] + 1。
注意到上面那个过程可以用后缀自动机加速。但是无论怎样都是 O(n^2) 的。

考虑直接在后缀自动机上 dp。问题在于后缀自动机的一个结点可以表示多个串,虽然结点数 O(n) 但能表示的串远多于 O(n)。

大胆猜测,最优解一定会取后缀自动机中某个结点表示的最长串。
证明?首先叶子结点满足。其次假如 i 的某一儿子 j 满足,采用反证法,设 j 的最长串只能够取 i 的非最长串为转移。
画一画 end-pos,发现上面那种情况下 j 的最长串的所有 end-pos 都有更长的串,因此矛盾。

然后就比较套路了。首先可持久化线段树合并求所有结点的 end-pos,通过线段树二分可以快速判断一个串是否能转移到另一个串。
能够转移到 i 的必然是 i 的祖先。看起来要二分,实际上可以直接从 i 的 fa 往下找即可(因为是单调的)。
总复杂度应该是 O(nlogn)?

@accepted code@

#include <cstdio>
#include <algorithm>
using namespace std;

const int MAXN = 200000;

struct edge{
	int to; edge *nxt;
}edges[2*MAXN + 5], *adj[2*MAXN + 5], *ecnt;
void addedge(int u, int v) {
	edge *p = (++ecnt);
	p->to = v, p->nxt = adj[u], adj[u] = p;
}

struct node{
	int pos, len;
	node *ch[26], *fa;
}pl[2*MAXN + 5], *ncnt, *root, *lst;
void extend(int x, int pos) {
	node *p = lst, *cur = (++ncnt); lst = cur;
	cur->pos = pos, cur->len = p->len + 1;
	while( p && p->ch[x] == NULL )
		p->ch[x] = cur, p = p->fa;
	if( !p ) cur->fa = root;
	else {
		node *q = p->ch[x];
		if( p->len + 1 == q->len )
			cur->fa = q;
		else {
			node *nq = (++ncnt); (*nq) = (*q);
			nq->len = p->len + 1, nq->pos = -1;
			q->fa = cur->fa = nq;
			while( p && p->ch[x] == q )
				p->ch[x] = nq, p = p->fa;
		}
	}
}
struct segtree{
	struct node{
		int mx;
		node *ch[2];
	}pl[80*MAXN + 5], *ncnt, *NIL;
	segtree() {
		ncnt = NIL = pl;
		NIL->ch[0] = NIL->ch[1] = NIL;
		NIL->mx = -1;
	}
	void pushup(node *x) {x->mx = max(x->ch[0]->mx, x->ch[1]->mx);}
	node *insert(int l, int r, int ps) {
		node *p = (++ncnt); p->mx = ps, p->ch[0] = p->ch[1] = NIL;
		if( l == r ) return p;
		int m = (l + r) >> 1;
		if( ps <= m ) p->ch[0] = insert(l, m, ps);
		else p->ch[1] = insert(m + 1, r, ps);
		return p;
	}
	node *merge(node *x, node *y) {
		if( x == NIL ) return y;
		if( y == NIL ) return x;
		node *p = (++ncnt);
		p->ch[0] = merge(x->ch[0], y->ch[0]);
		p->ch[1] = merge(x->ch[1], y->ch[1]);
		pushup(p); return p;
	}
	int query(node *x, int l, int r, int p) {
		if( l == r ) return p >= r ? x->mx : -1;
		int m = (l + r) >> 1;
		if( p <= m ) return query(x->ch[0], l, m, p);
		else return max(x->ch[0]->mx, query(x->ch[1], m + 1, r, p));
	}
}T;
int n;
segtree::node *rt[2*MAXN + 5];
void dfs1(int x, int fa) {
	if( pl[x].pos != -1 ) rt[x] = T.insert(1, n, pl[x].pos);
	else rt[x] = T.NIL;
	for(edge *p=adj[x];p;p=p->nxt) {
		if( p->to == fa ) continue;
		dfs1(p->to, x);
		rt[x] = T.merge(rt[x], rt[p->to]);
	}
}
int a[2*MAXN + 5], cnt, nw;
int f[2*MAXN + 5];
void dfs2(int x, int fa) {
	a[++cnt] = x;
	int tmp = nw;
	if( fa != -1 ) {
		int q = rt[x]->mx;
		while( true ) {
			int p = T.query(rt[a[nw]], 1, n, q - 1);
			if( !(q - pl[x].len <= p - pl[a[nw]].len) ) break;
			else nw++;
		}
		f[x] = f[a[nw - 1]]+1;
	}
	for(edge *p=adj[x];p;p=p->nxt) {
		if( p->to == fa ) continue;
		dfs2(p->to, x);
	}
	nw = tmp;
	a[cnt--] = 0;
}
void init() {ncnt = root = lst = pl, ecnt = edges; root->pos = -1;}
char s[MAXN + 5];
int main() {
	init(), scanf("%d%s", &n, s + 1);
	for(int i=1;i<=n;i++) extend(s[i] - 'a', i);
	for(int i=1;i<=ncnt-pl;i++) addedge(pl[i].fa-pl, i);
	dfs1(root - pl, -1), nw = 1, dfs2(root - pl, -1);
	int ans = 0;
	for(int i=1;i<=ncnt-pl;i++)
		ans = max(ans, f[i]);
	printf("%d
", ans);
}

@details@

后缀自动机里面根的信息需要特殊处理一下。

原文地址:https://www.cnblogs.com/Tiw-Air-OAO/p/12024599.html