uvalive4513

uvalive4513

题意

给出一个字符串,求其中最少出现 m 次的最长字符串。

分析

后缀数组做法:uva11107 的简化版,uva11107题解,二分枚举字符串长,分组判断是否出现 m 次,注意求的是起始位置的最大值,可能出现多种长度相同的字符串,要更新到起始位置最大值。

hash做法:对于不同的字符串赋不同的值(和 hash 函数的选择有关),那么相同的字符串具有相同的值,二分字符串长 L,从头开始枚举所有长度为 L 的字符串,如果相同数值的个数大于等于 m,即满足条件。

code(后缀数组)

#include<bits/stdc++.h>
using namespace std;
const int MAXN = 2e5 + 10;
char s[MAXN];
int sa[MAXN], t[MAXN], t2[MAXN], c[MAXN], n; // n 为 字符串长度 + 1,s[n - 1] = 0

int rnk[MAXN], height[MAXN];
// 构造字符串 s 的后缀数组。每个字符值必须为 0 ~ m-1
void build_sa(int m) {
    int i, *x = t, *y = t2;
    for(i = 0; i < m; i++) c[i] = 0;
    for(i = 0; i < n; i++) c[x[i] = s[i]]++;
    for(i = 1; i < m; i++) c[i] += c[i - 1];
    for(i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
    for(int k = 1; k <= n; k <<= 1) {
        int p = 0;
        for(i = n - k; i < n; i++) y[p++] = i;
        for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
        for(i = 0; i < m; i++) c[i] = 0;
        for(i = 0; i < n; i++) c[x[y[i]]]++;
        for(i = 0; i < m; i++) c[i] += c[i - 1];
        for(i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
        swap(x, y);
        p = 1; x[sa[0]] = 0;
        for(i = 1; i < n; i++)
            x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k] ? p - 1 : p++;
        if(p >= n) break;
        m = p;
    }
}
void getHeight() {
    int i, j, k = 0;
    for(i = 0; i < n; i++) rnk[sa[i]] = i;
    for(i = 0; i < n - 1; i++) {
        if(k) k--;
        j = sa[rnk[i] - 1];
        while(s[i + k] == s[j + k]) {
            k++;
        }
        height[rnk[i]] = k;
    }
}
// 保证 s[n-1] = 0 且前面非 0 // 也就是说空串
// sa[0] = n - 1,sa[i] 有效的只有 [1, n-1] ( 因为前面的 n 加 1 了 )表示第 i 位的是谁( 以第几个字符开始的字符串后缀 )
// height[i] 有效的只有 [2, n-1] 表示 lcp(sa[i], sa[i-1]) 最长公共前缀
int pos;
int check(int c, int m) {
    int cnt = 1;
    for(int i = 2; i < n; i++) {
        while(i < n && height[i] >= m) {
            cnt++;
            i++;
        }
        if(cnt >= c) return 1;
        cnt = 1;
    }
    return 0;
}
void getMaxPos(int c, int m) {
    int cnt = 1;
    int pp = sa[1];
    for(int i = 2; i < n; i++) {
        while(i < n && height[i] >= m) {
            pp = max(pp, sa[i]);
            cnt++;
            i++;
        }
        if(cnt >= c) {
            if(n - pp - 1 >= m) // 保证后缀串的长度至少为 m
                pos = max(pos, pp);
        }
        pp = sa[i];
        cnt = 1;
    }
}
int main() {
    int c;
    while(cin >> c && c) {
        cin >> s;
        n = strlen(s) + 1;
        build_sa(128);
        getHeight();
        int l = 0, r = n - 1, mid, ans = 0;
        pos = 0;
        while(l <= r) {
            mid = (l + r) / 2;
            if(check(c, mid)) { ans = mid; l = mid + 1; }
            else r = mid - 1;
        }
        getMaxPos(c, ans);
        if(!ans) puts("none");
        else printf("%d %d
", ans, pos);
    }
    return 0;
}

code(hash)

#include<bits/stdc++.h>
using namespace std;
typedef unsigned long long ull;
const int MAXN = 1e5 + 10;
const int X = 1207;
int n, m, pos;
char s[MAXN];
ull H[MAXN], xp[MAXN], Hash[MAXN];
int rnk[MAXN];
int cmp(const int& a, const int& b) {
    return Hash[a] < Hash[b] || (Hash[a] == Hash[b] && a < b);
}
int check(int L) {
    pos = -1;
    for(int i = 0; i < n - L + 1; i++) {
        rnk[i] = i;
        Hash[i] = H[i] - H[i + L] * xp[L];
    }
    sort(rnk, rnk + n - L + 1, cmp);
    int c = 0;
    for(int i = 0; i < n - L + 1; i++) {
        if(!i || Hash[rnk[i]] != Hash[rnk[i - 1]]) c = 0;
        if(++c >= m) pos = max(pos, rnk[i]);
    }
    return pos >= 0;
}
int main() {
    while(scanf("%d", &m) && m){
        scanf("%s", s);
        n = strlen(s);
        H[n] = 0;
        for(int i = n - 1; i >= 0; i--) {
            H[i] = H[i + 1] * X + s[i] - 'a';
        }
        xp[0] = 1;
        for(int i = 1; i < n; i++) {
            xp[i] = xp[i - 1] * X;
        }
        if(!check(1)) {
            puts("none");
        } else {
            int l = 1, r = n, mid, ans = 0;
            while(l <= r) {
                mid = (l + r) / 2;
                if(check(mid)) { l = mid + 1; ans = mid; }
                else r = mid - 1;
            }
            check(ans);
            printf("%d %d
", ans, pos);
        }
    }
    return 0;
}
原文地址:https://www.cnblogs.com/ftae/p/7197860.html