BZOJ3998 [TJOI2015]弦论 【后缀自动机】

题目

对于一个给定长度为N的字符串,求它的第K小子串是什么。

输入格式

第一行是一个仅由小写英文字母构成的字符串S

第二行为两个整数T和K,T为0则表示不同位置的相同子串算作一个。T=1则表示不同位置的相同子串算作多个。K的意义如题所述。

输出格式

输出仅一行,为一个数字串,为第K小的子串。如果子串数目不足K个,则输出-1

输入样例

aabc

0 3

输出样例

aab

提示

N<=5*10^5

T<2

K<=10^9

题解

肝了一个中午的论文还是想了好久这种裸题。。
由后缀自动机从根节点走每个节点都是一种子串的性质,我们能很快解决T=0的问题
T=0:
令每个节点值都为1【除了根】,按拓扑逆序向儿子统计
T=1:
每个点不再只是代表一个串了,其代表的串的个数等于其Right集合的大小
那么在parent树上统计每个点子树中的结束节点有多少个

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define LL long long int
#define REP(i,n) for (int i = 1; i <= (n); i++)
#define Redge(u) for (int k = h[u]; k; k = ed[k].nxt)
using namespace std;
const int maxn = 1000005,maxm = 100005,INF = 1000000000;
int pre[maxn],step[maxn],ch[maxn][26],last,cnt,n,sz[maxn];
int a[maxn],b[maxn],sum[maxn];
char s[maxn];
void ins(int x){
	int p = last,np = ++cnt;
	last = np; step[np] = step[p] + 1;
	while (p && !ch[p][x]) ch[p][x] = np,p = pre[p];
	if (!p) pre[np] = 1;
	else {
		int q = ch[p][x];
		if (step[q] == step[p] + 1) pre[np] = q;
		else {
			int nq = ++cnt; step[nq] = step[p] + 1;
			for (int i = 0; i < 26; i++) ch[nq][i] = ch[q][i];
			pre[nq] = pre[q]; pre[np] = pre[q] = nq;
			while (ch[p][x] == q) ch[p][x] = nq,p = pre[p];
		}
	}
	sz[np] = 1;
}
void dfs(int u,int k){
	if (k <= sz[u]) return;
	k -= sz[u];
	for (int i = 0; i < 26; i++){
		if (int t = ch[u][i]){
			if (k <= sum[t]){
				putchar('a'+ i);
				dfs(t,k);
				return;
			}
			k -= sum[t];
		}
	}
}
void solve(){
	int T,k;
	scanf("%d%d",&T,&k);
	REP(i,cnt) b[step[i]]++;
	REP(i,cnt) b[i] += b[i - 1];
	REP(i,cnt) a[b[step[i]]--] = i;
	for (int i = cnt; i; i--){
		int u = a[i];
		if (T == 1) sz[pre[u]] += sz[u];
		else sz[u] = 1;
	}
	sz[1] = 0;
	for (int i = cnt; i; i--){
		int u = a[i]; sum[u] = sz[u];
		for (int j = 0; j < 26; j++)
			sum[u] += sum[ch[u][j]];
	}
	REP(i,cnt) printf("%d ",sum[i]); puts("");
	if (k > sum[1]) {puts("-1"); return;}
	dfs(1,k);
}
int main(){
	scanf("%s",s + 1);
	n = strlen(s + 1); last = cnt = 1;
	REP(i,n) ins(s[i] - 'a');
	solve();
	return 0;
}

原文地址:https://www.cnblogs.com/Mychael/p/8304146.html