后缀数组

论文参见09年《后缀数组---处理字符串有力的工具》。

我参考了http://sbp810050504.blog.51cto.com/2799422/705445 这位大牛的博客。

先附已经亲手调好的求suffix[],rank[],height[]三个数组的代码。很多后缀数组的题目都是建立在这三个数组之上的。

#include <iostream>
#include <string.h>
#include <stdio.h>
#define maxn 1000
using namespace std;
int wa[1000],wb[1000],wv[1000],w[1000];
int cmp(int *r,int a,int b,int l){
    return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m){

    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++) w[i]=0;
    for(i=0;i<n;i++) w[x[i]=r[i]]++;
    for(i=1;i<m;i++) w[i]+=w[i-1];

    for(i=n-1;i>=0;i--) sa[--w[x[i]]]=i;

    for(j=1,p=1;p<n;j*=2,m=p){
        cout <<p << " "<<n<<endl;
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];

        for(i=0;i<m;i++) w[i]=0;
        for(i=0;i<n;i++) w[wv[i]]++;
        for(i=1;i<m;i++) w[i]+=w[i-1];

        for(i=n-1;i>=0;i--) sa[--w[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
    return;
}
int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
    int i,j,k=0;
    //for(i=1;i<=n;i++) rank[sa[i]]=i;
    for(i=0;i<n;height[rank[i++]]=k)
    for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
    return;
}
int main()
{
    int r[1000];
    int suffix[1000];
    char s[1000];
    //int h[1000];
    while(scanf("%s",s)!=EOF){
        int len=strlen(s);
        int up= 0;
        for(int i=0;i<len;i++){
            r[i]=s[i]-'a';
            if(up<r[i])
                up=r[i];
        }
        up++;
        da(r,suffix,len,up);
        for(int i=0;i<len;i++){
            rank[suffix[i]]=i;
        }
    printf("suffix[]:");
        for(int i=0;i<len;i++)
            printf("%d ",suffix[i]);
        cout << endl;
    printf("rank[]:");
        for(int i=0;i<len;i++)
            printf("%d ",rank[i]);
        cout << endl;
        calheight(r,suffix,len);
        //for(int i=0;i<len;i++)
            //rank[i]++;
    printf("height[]:");
        for(int i=1;i<len;i++){
            printf("%d ",height[i]);
        }
        cout << endl;
    }
    return 0;
}
原文地址:https://www.cnblogs.com/markliu/p/2747801.html