Spoj 694 Distinct Substrings(后缀数组)

Given a string, we need to find the total number of its distinct substrings.
Input
T- number of test cases. T<=20;
Each test case consists of one string, whose length is <= 1000
Output
For each test case output one number saying the number of distinct substrings.
Example
Sample Input:
2
CCCCC
ABABA
Sample Output:
5
9
Explanation for the testcase with string ABABA:
len=1 : A,B
len=2 : AB,BA
len=3 : ABA,BAB
len=4 : ABAB,BABA
len=5 : ABABA
Thus, total number of distinct substrings is 9.
给定一个字符串,求不相同的子串的个数.

/*
后缀数组.
给定一个字符串,求不相同的子串的个数.
题解比较机智.
对于一个串,加入它会有n-sa[i]-1个字串产生(下标从0开始)
但是有些贡献是重复算了的.
也就是ht[i],
所以ans=∑n-sa[i]-ht[i]-1.
*/
#include<iostream>
#include<cstring>
#include<cstdio>
#define MAXN 1001
using namespace std;
int n,m=130,s[MAXN],sa[MAXN],rank1[MAXN],ht[MAXN],ans,c[MAXN],t1[MAXN],t2[MAXN];
char ch[MAXN];
bool cmp(int *y,int a,int b,int k)
{
    int a1=y[a],b1=y[b];
    int a2=a+k>=n?-1:y[a+k];
    int b2=b+k>=n?-1:y[b+k];
    return a1==b1&&a2==b2;
}
void slovesa()
{
    int *x=t1,*y=t2;
    for(int i=0;i<m;i++) c[i]=0;
    for(int i=0;i<n;i++) c[x[i]=s[i]]++;
    for(int i=1;i<m;i++) c[i]+=c[i-1];
    for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
    for(int k=1,p=0;k<=n;k<<=1,m=p,p=0)
    {
        for(int i=n-k;i<n;i++) y[p++]=i;
        for(int i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
        for(int i=0;i<m;i++) c[i]=0;
        for(int i=0;i<n;i++) c[x[y[i]]]++;
        for(int i=1;i<m;i++) c[i]+=c[i-1];
        for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
        swap(x,y),p=1,x[sa[0]]=0;
        for(int i=1;i<n;i++)
        {
            if(cmp(y,sa[i-1],sa[i],k)) x[sa[i]]=p-1;
            else x[sa[i]]=p++;
        }
        if(p>=n) break;
    }
}
void Clear()
{
    ans=0;m=130;//1 w.
    memset(sa,0,sizeof sa);
}
void sloveheight()
{
    int k=0;
    for(int i=0;i<n;i++) rank1[sa[i]]=i;
    for(int i=0;i<n;ht[rank1[i++]]=k)
    {
        int j=sa[rank1[i]-1];
        if(k) k--;
        while(j+k<n&&i+k<n&&s[i+k]==s[j+k]) 
        k++;
    }
    ht[0]=0;
    for(int i=0;i<n;i++) 
    ans+=n-sa[i]-ht[i]-1;
}
int main()
{
    int t;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%s",ch);n=strlen(ch);Clear();
        for(int i=0;i<n;i++) s[i]=ch[i];
        s[n++]=0;
        slovesa(),sloveheight();
        printf("%d
",ans);
    }
    return 0;
}
原文地址:https://www.cnblogs.com/nancheng58/p/10068013.html