CF(427D-Match & Catch)后缀数组应用

题意:给两个字符串,求一个最短的子串。使得这个子串在两个字符串中出现的次数都等于1.出现的定义为:能够重叠的出现。


解法:后缀数组的应用。从小枚举长度。假设一个长度len合法的话:则一定存在这个样的sa[i]排名。sa[i]与s[i+1]的公共前缀长度大于等于len,且sa[i]与[i-1]的公共前缀长度小于len,同一时候sa[i+1]与[i+2]的公共前缀长度小于len,同一时候保证sa[i]与sa[i+1]在两个串中。Judge函数就是技巧性地实现了这些推断。


代码:

#include<iostream>
#include<string>
#include <cstring>
#include <string.h>
#include <stdio.h>
using namespace std;
const int MAX = 200100;

int n, num[MAX];
int sa[MAX], Rank[MAX], height[MAX];//sa[i]表示排名第i的后缀的位置,height[i]表示后缀SA[i]和SA[i-1]的最长公共前缀
int wa[MAX], wb[MAX], wv[MAX], wd[MAX];//名次数组 Rank[i] 保存的是 Suffix(i) 在全部后缀中从小到大排列的 “ 名次 ” 。
//简单的说,后缀数组(SA)是 “ 排第几的是谁? ” ,名次数组(RANK)是 “ 你排第几? ” 。 easy看出,后缀数组和名次数组为互逆运算。

int cmp(int *r, int a, int b, int l)
{
    return r[a] == r[b] && r[a+l] == r[b+l];
}

void da(int *r, int n, int m)            //  倍增算法0(nlgn)。
{
    int i, j, p, *x = wa, *y = wb, *t;
    for(i = 0; i < m; i ++) wd[i] = 0;
    for(i = 0; i < n; i ++) wd[x[i]=r[i]] ++;
    for(i = 1; i < m; i ++) wd[i] += wd[i-1];
    for(i = n-1; i >= 0; i --) sa[-- wd[x[i]]] = i;
    for(j = 1, p = 1; p < n; j *= 2, m = p)
    {
        for(p = 0, i = n-j; i < n; i ++) y[p ++] = i;
        for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j;
        for(i = 0; i < n; i ++) wv[i] = x[y[i]];
        for(i = 0; i < m; i ++) wd[i] = 0;
        for(i = 0; i < n; i ++) wd[wv[i]] ++;
        for(i = 1; i < m; i ++) wd[i] += wd[i-1];
        for(i = n-1; i >= 0; i --) sa[-- wd[wv[i]]] = y[i];
        for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++)
        {
            x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p - 1: p ++;
        }
    }
}

void calHeight(int *r, int n)            //  求height数组。
{
    int i, j, k = 0;
    for(i = 0; i < n; i ++) Rank[sa[i]] = i;
    for(i = 0; i < n; height[Rank[i ++]] = k)
    {
        for(k ? k -- : 0, j = sa[Rank[i]-1]; r[i+k] == r[j+k]; k ++);
    }
}

int len1=0;
int len2=0;
char s1[10000];
char s2[10000];
bool Judge(int n,int k)
{
    int a = 0,b = 0;
    for(int i = 0;i < n;i++)
    {
        if(height[i] < k)
        {
            if(a == 1 && b == 1)    return 1;
            a = b = 0;
        }
        if(sa[i] >= 0 && sa[i] < len1)  a++;
        if(sa[i] > len1 && sa[i] < n-1) b++;
    }
    return 0;
}
int main()
{
    scanf("%s%s",s1,s2);
    len1=strlen(s1);
    len2=strlen(s2);
    for(int i=0; i<len1; i++)
        num[i]=s1[i]-'a'+1;
    num[len1]=28;
    for(int i=0; i<len2; i++)
        num[i+len1+1]=s2[i]-'a'+1;

    da(num,len1+len2+2,30);
    calHeight(num,len1+len2+2);

    int len=min(len1,len2);
    int ans=-1;
    for(int i=1; i<=len; i++)
    {
        if(Judge(len1+len2+2,i))
        {
            ans=i;
            break;
        }
    }
    cout<<ans<<endl;
    return 0;
}
//20 5 19 20 19 5 20 19 5 19 28 20 5 5 16 20 5 19 0 0 0

原文地址:https://www.cnblogs.com/mengfanrong/p/4018639.html