【每日一题】两个数组的交集

349. 两个数组的交集

难度简单227

给定两个数组,编写一个函数来计算它们的交集。

示例 1:

输入:nums1 = [1,2,2,1], nums2 = [2,2]
输出:[2]

示例 2:

输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4]
输出:[9,4]

说明:

  • 输出结果中的每个元素一定是唯一的。
  • 我们可以不考虑输出结果的顺序。

思考

一、使用Set求解

  • HashSet在判断某个元素是否存在的效率是O(1)的。
  • 将nums1存入set中,遍历nums2,如果set中存在数,则将该数加入另一个res。
  • 取出res中的数即可。
    public int[] intersection(int[] nums1, int[] nums2) {
        Set<Integer> set = new HashSet<>();
        Set<Integer> res = new HashSet<>();
        for(int num : nums1) set.add(num); //[1,2,2,1] -> [1,2]
        for(int num : nums2){
            if(set.contains(num))  res.add(num);//[2]
        }
        int[]arr = new int[res.size()];
        int index = 0;
        for(int num : res) arr[index++] = num;
        return arr;
    }

时间复杂度(O(M+N)),HashSet在判断某个元素是否存在的效率是O(1)的,构建集合需要其中一个数组长度时间M,遍历另一个需要N。

空间复杂度(O(M+N)),需要两个集合长度的空间。

二、使用排序+双指针

  • 双指针使用前提是两个数组已经有序。
public int[] intersection(int[] nums1, int[] nums2) {
    Arrays.sort(nums1);
    Arrays.sort(nums2);
    Set<Integer> res = new HashSet<>();
    int i = 0, j = 0;
    while(i < nums1.length && j < nums2.length){
        if(nums1[i] == nums2[j]){
            res.add(nums1[i]);
            i++;j++;
        }else if(nums1[i] < nums2[j]){
            i++;
        }else{
            j++;
        }
    }
    int[] arr = new int[res.size()];
    int index = 0;
    for(int num : res) arr[index++]  = num;
    return arr;
}

时间复杂度:(O(2NlogN + max(N,M))),排序的时间复杂度是 (NlogN),双指针N。

空间复杂度:(O(N))

350. 两个数组的交集 II

给定两个数组,编写一个函数来计算它们的交集。

示例 1:

输入:nums1 = [1,2,2,1], nums2 = [2,2]
输出:[2,2]

示例 2:

输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4]
输出:[4,9]

说明:

  • 输出结果中每个元素出现的次数,应与元素在两个数组中出现次数的最小值一致。
  • 我们可以不考虑输出结果的顺序。

进阶:

  • 如果给定的数组已经排好序呢?你将如何优化你的算法?
  • 如果 nums1 的大小比 nums2 小很多,哪种方法更优?
  • 如果 nums2 的元素存储在磁盘上,内存是有限的,并且你不能一次加载所有的元素到内存中,你该怎么办?

思考

一、排序+双指针

其实在排序情况下,直接将set改成list就可以了。

二、哈希计数

参考:https://leetcode-cn.com/problems/intersection-of-two-arrays-ii/solution/liang-ge-shu-zu-de-jiao-ji-ii-by-leetcode-solution/

  1. 遍历第一个数组,在哈希表中记录出现的数字和出现的次数。
  2. 遍历第二个数组,如果哈希表中存在这个数,加入答案,并减少哈希表中数字出现的次数。
  3. 为了降低空间复杂度,首先遍历较短的的数组并记录出现的次数。
    public int[] intersect(int[] nums1, int[] nums2) {

        if (nums1.length > nums2.length) {
            return intersect(nums2, nums1);
        }
        Map<Integer, Integer> map = new HashMap<Integer, Integer>();
        for (int num : nums1) {
            map.put(num, map.getOrDefault(num, 0) + 1);
        }
        int[] res = new int[nums1.length];
        int index = 0;
        for (int num : nums2) {
            int count = map.getOrDefault(num, 0);
            if (count > 0) {
                res[index++] = num;
                count--;
                if (count > 0) {
                    map.put(num, count);
                } else {
                    map.remove(num);
                }
            }
        }
        return Arrays.copyOfRange(res, 0, index);
    }

时间复杂度(O(m+n)),其中 m 和 n 分别是两个数组的长度。需要遍历两个数组并对哈希表进行操作,哈希表操作的时间复杂度是 (O(1)),因此总时间复杂度与两个数组的长度和呈线性关系。

空间复杂度(O(min(m,n))),其中 m 和 n 分别是两个数组的长度。对较短的数组进行哈希表的操作,哈希表的大小不会超过较短的数组的长度。为返回值创建一个数组 res,其长度为较短的数组的长度。

如果nums2的元素存储在磁盘上,内存非常小,不足以将数组全部载入内存,此时会出现两种情况:

  • nums1数据量很小,可以完全加载到内存中,使用哈希计数,然后逐步从磁盘扫描nums2。
  • nums1数据量很大,两者都无法加载到内存中,这时需要使用外部排序【归并排序】,将分割后的子数组写到单个文件中,归并时将小文件合并为更大的文件。
原文地址:https://www.cnblogs.com/summerday152/p/13626848.html