POJ 3080 Blue Jeans (后缀数组)

题目大意:

求出这些DNA序列中的最长且字典序最小的公共子串。


思路分析:

二分长度的答案,去height中扫描这个长度是否满足,一旦满足就立即输出。这样就能够保证字典序最小了。


#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
#define maxn 1005
using namespace std;

char str[maxn];
int sa[maxn],t1[maxn],t2[maxn],c[maxn],n;

void suffix(int m)
{
    int *x=t1,*y=t2;
    for(int i=0;i<m;i++)c[i]=0;
    for(int i=0;i<n;i++)c[x[i]=str[i]]++;
    for(int i=1;i<m;i++)c[i]+=c[i-1];
    for(int i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
    for(int k=1;k<=n;k<<=1)
    {
        int p=0;
        for(int i=n-k;i<n;i++)y[p++]=i;
        for(int i=0;i<n;i++)if(sa[i]>=k)y[p++]=sa[i]-k;
        for(int i=0;i<m;i++)c[i]=0;
        for(int i=0;i<n;i++)c[x[y[i]]]++;
        for(int i=0;i<m;i++)c[i]+=c[i-1];
        for(int i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1;x[sa[0]]=0;
        for(int i=1;i<n;i++)
        x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
        if(p>=n)break;
        m=p;
    }
}
int rank[maxn],height[maxn];
void getheight()
{
    int k=0;
    for(int i=0;i<n;i++)rank[sa[i]]=i;
    for(int i=0;i<n;i++)
    {
        if(k)k--;
        if(!rank[i])continue;
        int j=sa[rank[i]-1];
        while(str[i+k]==str[j+k])k++;
        height[rank[i]]=k;
    }
}
int pos,N,fans;
bool vis[20];
int bel[maxn];

bool ok()
{
    for(int i=1;i<=N;i++)
        if(!vis[i])return false;
    return true;
}
bool check(int len)
{
    pos=-1;
    memset(vis,false,sizeof vis);

    int i;
    for(i=1;i<n;i++)
    {
        if( height[i]<len )
        {
            if(ok())
            {
                pos=sa[i-1];
                return true;
            }
            memset(vis,false,sizeof vis);
        }
        else
        {
            if(!vis[bel[sa[i-1]]])vis[bel[sa[i-1]]]=true;
            if(!vis[bel[sa[i]]])vis[bel[sa[i]]]=true;
            if(ok())
            {
                pos=sa[i];
                return true;
            }
        }
    }
    if(ok())pos=sa[i-1];
    return pos!=-1;
}
char tmp[100];
int main()
{
    int T;
    scanf("%d",&T);
    while(T--)
    {
        scanf("%d",&N);
        int top=0;
        for(int i=1;i<=N;i++)
        {
            scanf("%s",tmp);
            for(int j=0;j<60;j++)
            {
                bel[top]=i;
                str[top++]=tmp[j];
            }
            bel[top]=i;
            str[top++]=127-i;
        }
        str[top-1]=0;

        n=top;

        suffix(128);
        getheight();

        int l=3,r=60,mid,ans=0;
        while(l<=r)
        {
            mid=(l+r)>>1;
            if(check(mid))ans=mid,fans=pos,l=mid+1;
            else r=mid-1;
        }
        if(ans<3)printf("no significant commonalities");
        else
        {
            for(int i=fans;i<fans+ans;i++)printf("%c",str[i]);
        }
        puts("");
    }
    return 0;
}


原文地址:https://www.cnblogs.com/gavanwanggw/p/6884058.html