[718. 最长重复子数组]

[718. 最长重复子数组]

给两个整数数组 AB ,返回两个数组中公共的、长度最长的子数组的长度。

示例 1:

输入:
A: [1,2,3,2,1]
B: [3,2,1,4,7]
输出: 3
解释: 
长度最长的公共子数组是 [3, 2, 1]。

说明:

  1. 1 <= len(A), len(B) <= 1000
  2. 0 <= A[i], B[i] < 100

思路:动态规划

​ dp[i] [j] 表示以i, j 为结尾的连续公共子数组

那么:

dp[i][j] = A[i] == B[j] ? dp[i+1][j+1]+1 : 0;

public int findLength(int[] A, int[] B) {
        int maxLen = 0;
        int[][] dp = new int[A.length+1][B.length+1];

        for (int i = A.length-1; i >= 0; i--) {
            for (int j = B.length-1; j >= 0; j--) {
                dp[i][j] = A[i] == B[j] ? dp[i+1][j+1]+1 : 0;
                maxLen = Math.max(maxLen, dp[i][j]);
            }
        }

        return maxLen;
    }

思路二 :滑动窗口

分别将AB数组按不同的偏移量对齐即可

public int findLength(int[] A, int[] B) {
        int maxLen = 0;
        //A数组向前移
        for (int i = 0; i < A.length-1; i++) {
            //分别表示AB的指针和他们前一位的最大公共子数组长度
            int ai = i, bi = 0, last = 0;
            while (ai < A.length && bi < B.length){
                last = A[ai++] == B[bi++] ? last+1: 0;
                maxLen = Math.max(maxLen, last );
            }
        }
        //B数组向前移
        for (int i = 0; i < B.length-1; i++) {
            //分别表示AB的指针和他们前一位的最大公共子数组长度
            int ai = 0, bi = i, last = 0;
            while (ai < A.length && bi < B.length){
                last = A[ai++] == B[bi++] ? last+1: 0;
                maxLen = Math.max(maxLen, last );
            }
        }

        return maxLen;
    }

思路三 :二分+hash

如果数组 A 和 B 有一个长度为 k 的公共子数组,那么它们一定有长度为 j <= k 的公共子数组。这样我们可以通过二分查找的方法找到最大的 k。

而为了优化时间复杂度,在二分查找的每一步中,我们可以考虑使用哈希的方法来判断数组 A 和 B 中是否存在相同特定长度的子数组。

注意到序列内元素值小于 100100100 ,我们使用 Rabin-Karp 算法来对序列进行哈希。具体地,我们制定一个素数 base,那么序列 S 的哈希值为:

形象地说,就是把 S 看成一个类似 base 进制的数(左侧为高位,右侧为低位),它的十进制值就是这个它的哈希值。由于这个值一般会非常大,因此会将它对另一个素数 mod 取模。

当我们要在一个序列 S 中算出所有长度为 len 的子序列的哈希值时,我们可以用类似滑动窗口的方法,在线性时间内得到这些子序列的哈希值。例如,如果我们当前得到了 S[0:len] 的哈希值,希望算出 S[1:len+1] 的哈希值时,有下面这个公式:

即删去最高位 S[0],其余位自动进一,并补上最低位 S[len+1]。

在二分查找的每一步中,我们使用哈希表分别存储这两个数组的所有长度为 len 的子数组的哈希值,将它们的哈希值进行比对,如果两序列存在相同的哈希值,则认为两序列存在相同的子数组。为了防止哈希碰撞,我们也可以在发现两个子数组的哈希值相等时,进一步校验它们本身是否确实相同,以确保正确性。但该方法在本题中很难发生哈希碰撞,因此略去进一步校验的部分。

class Solution {
    int mod = 1000000009;
    int base = 113;

    public int findLength(int[] A, int[] B) {
        int left = 1, right = Math.min(A.length, B.length) + 1;
        while (left < right) {
            int mid = (left + right) >> 1;
            if (check(A, B, mid)) {
                left = mid + 1;
            } else {
                right = mid;
            }
        }
        return left - 1;
    }

    public boolean check(int[] A, int[] B, int len) {
        long hashA = 0;
        for (int i = 0; i < len; i++) {
            hashA = (hashA * base + A[i]) % mod;
        }
        Set<Long> bucketA = new HashSet<Long>();
        bucketA.add(hashA);
        long mult = qPow(base, len - 1);
        for (int i = len; i < A.length; i++) {
            hashA = ((hashA - A[i - len] * mult % mod + mod) % mod * base + A[i]) % mod;
            bucketA.add(hashA);
        }
        long hashB = 0;
        for (int i = 0; i < len; i++) {
            hashB = (hashB * base + B[i]) % mod;
        }
        if (bucketA.contains(hashB)) {
            return true;
        }
        for (int i = len; i < B.length; i++) {
            hashB = ((hashB - B[i - len] * mult % mod + mod) % mod * base + B[i]) % mod;
            if (bucketA.contains(hashB)) {
                return true;
            }
        }
        return false;
    }
    
    // 使用快速幂计算 x^n % mod 的值
    public long qPow(long x, long n) {
        long ret = 1;
        while (n != 0) {
            if ((n & 1) != 0) {
                ret = ret * x % mod;
            }
            x = x * x % mod;
            n >>= 1;
        }
        return ret;
    }
}
因为我喜欢追寻过程中的自己
原文地址:https://www.cnblogs.com/IzuruKamuku/p/14359758.html