「解题报告」[JSOI2019] 节日庆典 (扩展kmp)

「解题报告」[JSOI2019] 节日庆典 (扩展kmp)

传送门

题面

题意

给定一个字符串 (s) (起始位置为 (1)), 对 (s) 的每个前缀求出最小循环表示的起始位置.

输入样例

abaacaba

输出样例

1 1 3 3 3 6 3 8

数据范围

(|s| le 3 imes 10^6).


思路

假设先从前往后扫一遍, 则对于每个前缀, 它的某些后缀可以作为最优答案 (我们称它为有效的), 有些后缀可以被排除.

并且我们可以证明 : 对于每个前缀, 它的有效后缀数量为 (O(log n)).

证明

我们规定 : 以一个前缀的结束位置来命名这个前缀, 以一个后缀的起始位置来命名这个后缀. (|i|) 表示后缀 (i) 的长度.

对于前缀 (R), 我们把它的有效后缀按照起始位置从小到大排序, 设 (i,j) 为它的两个相邻有效后缀.

因为它们都有可能得到最优答案, 所以后缀 (j) 是后缀 (i) 的一个前缀. 有因为后缀 (j) 是后缀 (i) 的一个后缀, 所以后缀 (j) 是后缀 (i) 的一个 (border). (图中蓝括号部分和红括号部分对应相等)

所以, 后缀 (i) 可以用一个长度为 (j-i) 的字符串循环表示. (图中箭头所指部分对应相等)

(k=j+(j-i))

假设 (j) 是前缀 (R) 的最优解, 那么就会存在两个点 (S,T(T-S=j-i)), 使得字符串 ([i,S] >) 字符串 ([j,T]). (图中分别表示为 (I,J))

由于字符串 (A,B) 对应相等, 所以字符串 (C>D).

那么, 也就会使得字符串 ([j,S] > [k,T]). (图中分别表示为 (J',K))

也就是说, (k) 会代替 (j) 成为前缀 (R) 的最优解, 那 (j) 就不是一个「有效后缀」, 与假设矛盾.

故, 对于前缀 (R) 的两个相邻有效后缀 (i,j), 必定满足 (|i| ge |j|). 所以前缀 (R) 最多只会有 (log R) 个有效后缀.

具体实现

首先是找出有效后缀. 我们从前往后枚举 (R), 并维护一个栈来存储当前的有效后缀, 具体见代码.

然后是找出这若干个有效后缀中的最优解. 对于两个有效后缀 (i,j (i<j)), 为了比较它们的大小, 我们需要找出后缀 (i+r-j) 与后缀 (1)(LCP) (最长公共前缀), 然后比较它们第一位不相等的字符来决定它们的大小. 每个后缀的 (LCP) 可以通过 (Z) 算法 (扩展 (kmp)) 解决.


代码

#include<bits/stdc++.h>

using namespace std;

#define pb push_back
#define sz(x) (int)(x).size()

const int _=3e6+7;

int n,z[_],lst[_],num,stk[_],top;
string s;


void Z(){
	int l=0,r=0;
	for(int i=1;i<n;i++){
		if(i<r) z[i]=min(r-i+1,z[i-l]);
		while(i+z[i]<n&&s[i+z[i]]==s[z[i]]) z[i]++;
		if(i+z[i]-1>r) l=i,r=i+z[i]-1;
	}
	z[0]=n;
}

void Init(){
	cin>>s,n=s.size();
	Z();
}

int Min(int &x,int y,int r){
	if(!x) return y;
	int t=y+r-x+1;
	if(t+z[t]-1>=r) return y; // 可以证明, 当后缀 y+r-x 与后缀 1 的 LCP 延伸的长度大于等于 r 时, x 一定不是最优解
	return s[t+z[t]]<s[z[t]] ?y :x;
}

void Run(){
	printf("%d ",1);
	lst[num=1]=0;
	for(int r=1;r<n;r++){
		stk[top=1]=r;
		for(int i=1;i<=num;i++){
			while(top&&(s[lst[i]+r-stk[top]]<s[r])) top--;
			if(top&&s[lst[i]+r-stk[top]]==s[r]&&r-lst[i]+1<2*(r-stk[top]+1)) top--;
			if(!top||s[lst[i]+r-stk[top]]==s[r]) stk[++top]=lst[i];
		}
		
		num=top;
		int minx=0;
		for(int i=1;i<=top;i++){
			lst[i]=stk[i];
			minx=Min(minx,stk[i],r);
		}
		printf("%d ",minx+1);
	}
	putchar('
');
}

int main(){
#ifndef ONLINE_JUDGE
	freopen("x.in","r",stdin);
	freopen("x.out","w",stdout);
#endif
	Init();
	Run();
	return 0;
}
原文地址:https://www.cnblogs.com/BruceW/p/13143857.html