2020牛客暑期多校训练营(第一场) B-Suffix Array 后缀数组

题意

给你一个长度为(n)的字符串(S),定义(B)数组为:

  • 如果存在一个位置(j<i)满足(S_j=S_i)(B_i=min_{1le j<i,S_j=S_i}{i-j})
  • 否则,(B_i=0)

对字符串(S)(n)个后缀的(B)数组按字典序排序,输出排序结果。

分析

定义字符串(S)(n)个后缀分别为(s_1,s_2,dots,s_n),分别对应的(B)数组为(b_1,b_2,dots,b_n),能发现(b_2,b_3,dots,b_n)(b_1)除了自己本身的所有后缀只是第一个‘a'的位置和第一个’b'的位置变成了(0),而它们之间的位置一定都是(1),所以(S)的每个后缀的(B)数组分成两部分,一部分是前面的一段(01)串,对于同时存在‘a'和’b'的后缀,(01)串越长的字典序一定越大,如果长度相同,后面的一部分可以对(b_1)建后缀数组,用后缀数组来判断后面一部分字典序的大小,通过这个比较方法排序一下就可以了。

对于只有‘a'或只有’b'的后缀,它的(B)数组一定是(0)后面有若干个(1),特判一下就好了。

Code

#include<algorithm>
#include<iostream>
#include<cstring>
#include<iomanip>
#include<sstream>
#include<cstdio>
#include<string>
#include<vector>
#include<bitset>
#include<queue>
#include<cmath>
#include<stack>
#include<set>
#include<map>
#define rep(i,x,n) for(int i=x;i<=n;++i)
#define per(i,n,x) for(int i=n;i>=x;i--)
#define sz(a) int(a.size())
#define rson mid+1,r,p<<1|1
#define pii pair<int,int>
#define lson l,mid,p<<1
#define ll long long
#define pb push_back
#define mp make_pair
#define se second
#define fi first
using namespace std;
const double eps=1e-8;
const int mod=1e9+7;
const int N=1e5+10;
const int inf=1e9;
int n,b[N],sa[N],rk[N],wb[N],c[N],f[N][2],pre[2],d[N];
char s[N];
void bd(int m){
    int *x=rk,*y=wb;
	rep(i,1,m) c[i]=0;
	rep(i,1,n) ++c[x[i]=b[i]];
	rep(i,2,m) c[i]+=c[i-1];
	per(i,n,1) sa[c[x[i]]--]=i;
	for(int k=1;k<=n;k<<=1){
		int p=0;
		rep(i,n-k+1,n) y[++p]=i;
		rep(i,1,n) if(sa[i]>k) y[++p]=sa[i]-k;
		rep(i,1,m) c[i]=0;
		rep(i,1,n) ++c[ x[y[i]] ];
		rep(i,2,m) c[i]+=c[i-1];
		per(i,n,1) sa[ c[x[y[i]]]-- ]=y[i],y[i]=0;
		swap(x,y);
		x[sa[1]]=1;
		p=1;
		rep(i,2,n)
			x[sa[i]]= (y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]) ? p : ++p;
		if(p>=n) break;
		m=p;
	}

}
bool cmp(int x,int y){
	int l1=1,l2=1;
	if(f[x][0]&&f[x][1]) l1=max(f[x][0],f[x][1])-min(f[x][0],f[x][1])+1;
	if(f[y][0]&&f[y][1]) l2=max(f[y][0],f[y][1])-min(f[y][0],f[y][1])+1;
	if(l1==l2){
	    if(x+l1>n) return true;
        if(y+l2>n) return false;
        return rk[x+l1]<rk[y+l2];
	}
	if(l1==1){
            if(n-x+1<=l2-1) return true;
            return false;
	}
	if(l2==1){
            if(n-y+1<=l1-1) return false;
            return true;
	}
	return l1<l2;
}
int main(){
	//ios::sync_with_stdio(false);
	//freopen("in","r",stdin);
	while(~scanf("%d",&n)){
        f[n+1][0]=f[n+1][1]=pre[0]=pre[1]=0;
		scanf("%s",s+1);
		int mx=0;
		rep(i,1,n){
			if(pre[s[i]-'a']) b[i]=i-pre[s[i]-'a']+1;
			else b[i]=1;
			pre[s[i]-'a']=i;
			d[i]=i;
			mx=max(mx,b[i]);
		}
		per(i,n,1){
			rep(j,0,1) f[i][j]=f[i+1][j];
			f[i][s[i]-'a']=i;
		}
		bd(mx);
		rep(i,1,n) rk[sa[i]]=i;
		sort(d+1,d+n+1,cmp);
		rep(i,1,n){
		    printf("%d%c",d[i],i==n?'
':' ');
		}
	}
	return 0;
}
原文地址:https://www.cnblogs.com/xyq0220/p/13321445.html