力扣398-随机数索引-(蓄水池抽样算法)

https://leetcode-cn.com/problems/random-pick-index/

给定一个可能含有重复元素的整数数组,要求随机输出给定的数字的索引。 您可以假设给定的数字一定存在于数组中。

注意:
数组大小可能非常大。 使用太多额外空间的解决方案将不会通过测试。

示例:

int[] nums = new int[] {1,2,3,3,3};
Solution solution = new Solution(nums);

// pick(3) 应该返回索引 2,3 或者 4。每个索引的返回概率应该相等。
solution.pick(3);

// pick(1) 应该返回 0。因为只有nums[0]等于1。
solution.pick(1);

重述题意:求一个数a在数组中等可能出现的下标idx是多少?

(1)竞赛思维

追求时间不追求空间,对每一个开一个可变长数组来存储,例如C++中的vector(如果a太大,用map映射到邻接表的一维下标,数组长度总不可能超过map的大小),存储a的各个出现的下标,然后rand()%length即所求的下标。概率是相等的。

效率分析:预处理时间复杂度0(n),空间复杂度O(n),对于多个pick操作都可以在O(1)求得。

(2)面试思维

本题追求空间不追求时间,每遇见一个a,计数cnt+1,然后判断随机数r%cnt是否等于0,如果等于就把答案idx赋值为当前答案。这就是所谓的蓄水池抽样算法,验证一下概率的等可能性。

  • 如果只有1个数,概率是1
  • 如果只有2个数,概率是1/2
  • 如果只有3个数,概率是1/3
  • ...
  • 如果只有(n-1)个数,概率是1/(n-1)
  • 如果只有n个数,概率是1/n

从第n个等于a的数逆推

  • 遇到第n个数时,cnt加到n了,r%n==0的概率是1/n,第n个idx被选中的概率是1/n
  • 回溯到第n-1个数时,cnt=n-1,r%(n-1)==0的概率是1/(n-1),判断第n-1个idx被选中的概率是1/(n-1)
  • ...
  • 回溯到第2个数时,cnt=2,r%2==0的概率是1/2,判断第2个idx被选中的概率是1/2
  • 回溯到第1个数时,cnt=2,r%1==0的概率是1,判断第1个数idx被选中的概率是1

把前m个数和第m+1个数分离,前m个数自己去算概率,遇到第m+1个数时,只要求第m+1个数的概率。

效率分析:空间复杂度O(1),每次pick的时间复杂度是0(n),如果有m个pick操作,时间复杂度是O(n*m)

class Solution {
    static int[] nums;
    public Solution(int[] nums) {
        this.nums=nums;
    }
    
    public int pick(int a) {
        Random r=new Random();
        int cnt=0;
        int ans=-1;
        for(int i=0;i<nums.length;i++){
            if(a==nums[i]){
                cnt++;
                if(r.nextInt()%cnt==0)
                    ans=i;
            }
        }
        return ans;
    }
}

/**
 * Your Solution object will be instantiated and called as such:
 * Solution obj = new Solution(nums);
 * int param_1 = obj.pick(target);
 */

 

原文地址:https://www.cnblogs.com/shoulinniao/p/12870980.html