poj 3294 后缀数组+二分

题目大意:

给定n个字符串,求出现在不小于k个字符串中的最长子串

基本思路:

二分长度,统计个数,一般套路,就是这个跟说好的不一样啊,我非得开2倍才不re,真他妈不爽,先二分找出长度,然后根据长度输出字符串;

代码如下:

#include<cstdio>
#include<cstring>
using namespace std;

typedef  long long ll;
const int inf = 0x3f3f3f3f;
const int maxn = 200000+10;
int wa[maxn],wb[maxn],wv[maxn],ws[maxn],sa[maxn],ranks[maxn],height[maxn];
char str[1010],ans[1010];
int s[maxn],loc[maxn];
bool vis[1001];
int num;
int cmp(int *r,int a,int b,int l){
    return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int *r,int n,int m){
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++) ws[i]=0;
    for(i=0;i<n;i++) ws[x[i]=r[i]]++;
    for(i=1;i<m;i++) ws[i]+=ws[i-1];
    for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p){
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<m;i++) ws[i]=0;
        for(i=0;i<n;i++) ws[wv[i]]++;
        for(i=1;i<m;i++) ws[i]+=ws[i-1];
        for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}
void calHeight(int *r,int n){
    int i,j,k=0;
    for(i=1;i<=n;i++) ranks[sa[i]]=i;
    for(i=0;i<n;i++){
        if(k) k-=1;
        j=sa[ranks[i]-1];
        while(r[i+k]==r[j+k]) k++;
        height[ranks[i]]=k;
    }
}
bool check(int mid,int len){
    memset(vis,false,sizeof(vis));
    int cnt=0;
    for(int i=2;i<=len;i++){
        if(height[i]<mid){
            memset(vis,false,sizeof(vis));
            cnt=0;
            continue;
        }
        if(!vis[loc[sa[i-1]]]){
            vis[loc[sa[i-1]]]=true;
            cnt++;
        }
        if(!vis[loc[sa[i]]]){
            vis[loc[sa[i]]]=true;
            cnt++;
        }
        if(cnt>num/2) return true;
    }
    return false;
}
void print(int mid,int len){
    int cnt=0,tag=0;
    memset(vis,false,sizeof(vis));
    for(int i=2;i<=len;i++){
        if(height[i]<mid){
            memset(vis,false,sizeof(vis));
            cnt=0;
            tag=0;
            continue;
        }
        if(!vis[loc[sa[i-1]]]){
            vis[loc[sa[i-1]]]=true;
            cnt++;
        }
        if(!vis[loc[sa[i]]]){
            vis[loc[sa[i]]]=true;
            cnt++;
        }
        if(cnt>num/2&&!tag){
            for(int j=0;j<mid;j++){
                ans[j]=s[sa[i]+j]+'a'-1;
            }
            ans[mid]='';
            printf("%s
",ans);
            tag=1;
        }
    }
}
int main(){
    while(scanf("%d",&num)==1&&num){
        int cnt=0,tmp=30;
        for(int i=1;i<=num;i++){
            scanf("%s",str);
            int len=strlen(str);
            for(int j=0;j<len;j++){
                loc[cnt]=i;
                s[cnt++]=str[j]-'a'+1;
            }
            loc[cnt]=tmp;
            s[cnt++]=tmp++;
        }
        s[cnt]=0;
        da(s,cnt+1,tmp);
        calHeight(s,cnt);
        int left=1,right=strlen(str),mid,flag=0;
        while(right>=left){
            mid=(left+right)/2;
            if(check(mid,cnt)){
                left=mid+1;
                flag=mid;
            }else{
                right=mid-1;
            }
        }
        if(flag){
            print(flag,cnt);
            printf("
");
        }else{
            printf("?

");
        }
    }
    return 0;
}

  

原文地址:https://www.cnblogs.com/imzscilovecode/p/8000808.html