acwing 140. 后缀数组

题面:

后缀数组 (SA) 是一种重要的数据结构,通常使用倍增或者DC3算法实现,这超出了我们的讨论范围。

在本题中,我们希望使用快排、Hash与二分实现一个简单的O(nlog2n)O(nlog2n)的后缀数组求法。

详细地说,给定一个长度为 n 的字符串S(下标 0~n-1),我们可以用整数 k(0k<n0≤k<n) 表示字符串S的后缀 S(k~n-1)。

把字符串S的所有后缀按照字典序排列,排名为 i 的后缀记为 SA[i]。

额外地,我们考虑排名为 i 的后缀与排名为 i-1 的后缀,把二者的最长公共前缀的长度记为 Height[i]。

我们的任务就是求出SA与Height这两个数组。

输入格式

输入一个字符串,其长度不超过30万。

输出格式

第一行为数组SA,相邻两个整数用1个空格隔开。

第二行为数组Height,相邻两个整数用1个空格隔开,我们规定Height[1]=0。

输入样例:

ponoiiipoi

输出样例:

9 4 5 6 2 8 3 1 7 0
0 1 2 1 0 0 2 1 0 2
题解:
二分得出两个开头后缀的最长前缀,然后根据不同的写个排序函数排序,
#include<iostream>
#include<algorithm>
#include<cstring>
#define ull unsigned long long
using namespace std;
const ull base=131;
const ull INT_MIN=-1e6;
ull h[300010],p[300010];
int sa[300010];int n;
char str[300010];
ull get(int l,int r)
{
    return h[r]-h[l-1]*p[r-l+1];
}
int get_max(int a,int b)
{
    int l=0;int r=min(n-a+1,n-b+1);
    while(l<r)
    {
        int mid=(r + l+ 1) >> 1;
        if(get(a,a+mid-1)!=get(b,b+mid-1))r=mid-1;
        else
        l=mid;
    }
    return l;
}
bool cmp(int a,int b)//排序函数
{
    int l=get_max(a,b);
    int av=a+l>n?INT_MIN:str[a+l];
    int bv=b+l>n?INT_MIN:str[b+l];
    return av<bv;//从小到大排列;
}
int main()
{
    scanf("%s",str+1);
    n=strlen(str+1);p[0]=1;
    for(int i=1;i<=n;i++)
    {
        h[i]=h[i-1]*base+str[i]-'a'+1;
        p[i]=p[i-1]*base;
        sa[i]=i;
    }
    sort(sa+1,sa+n+1,cmp);
    for(int i=1;i<=n;i++)printf("%d ",sa[i]-1);
    puts("");
    for(int i=1;i<=n;i++)
    {
        if(i==1)printf("0 ");
        else
        printf("%d ",get_max(sa[i],sa[i-1]));
    }
    puts("");
    return 0;
}
原文地址:https://www.cnblogs.com/flyljz/p/11649133.html