从1亿个数里面找出前100个最大的

这个题目应该是一些大公司面试题中经常被问到的,这里我给出一种做法,至于面试官满不满意我就不知道了。我们知道,这种找出前多少个最大或者最小的最适合用堆排序(对堆排序不熟悉的读者可以参考为的这篇博客:堆排序)。但是如果我们用1亿个数去建堆并调整,当然时间复杂度是不允许的。题目中要求前100个大的,那么我们就只用100个数建堆,而且是建立成最小堆。剩下的1亿减100个数依次和堆顶元素比较,如果比堆顶元素小,那么不管它。如果比堆顶元素大,就用这个元素把堆顶元素替换掉,然后调整堆,继续保持最小堆的性质。直到剩下的所有元素都和堆顶元素比较完毕。那么堆中的100个数就是最大的。假设一共是n个数,找前m个大的。第一次建堆并调整的时间大约为mlog(m),那么对于剩下的每个元素,最坏的情况下就是每个都调整堆,堆调整一次的时间复杂度为log(m),所以总的时间复杂度为(n-m)log(m) + mlog(m) = nlog(m)

public class Demo {
    
    public static void main(String[] args) {
        int n = 10000;
        int m = 10;
        int[] arr = new int[n];
        for(int i = 0; i < n; i++) {
            arr[i] = i + 1;
        }
        print(arr,n);
        for(int i = 0; i < m; i++) {
            System.out.print(arr[i] + " ");
        }
    }
    
    //剩下的n-m个数与堆顶元素依次比较,并调整堆结构
    public static void print(int[] arr, int m) {
        //把前m个数建成最小堆
        createSmallHeap(arr,m); 
        //把剩下的arr.length-m个数字依次与最小堆的堆顶元素比较
        //如果比堆顶元素大,那么就替换为堆顶,然后对堆顶进行调整。
        //当所有的元素遍历一遍后,堆中元素就是前m个最大的。
        for(int i = m; i < arr.length; i++) {
            if(arr[i] > arr[0]) {
                arr[0] = arr[i];
                adjustHeap(arr,m,0);
            }
        }
    }
    
    //新建堆
    public static void createSmallHeap(int[] arr, int m) {
        for(int i = m / 2 - 1; i >= 0; i--) {
            adjustHeap(arr, m, i);
        }
    }
    
    //调整为最小堆
    public static void adjustHeap(int[] arr, int m, int i) {
        int temp = arr[i];
        for(int k = 2 * i + 1; k < m; k = 2 * k + 1) {
            if(k + 1 < m && arr[k + 1] < arr[k]) k++;
            if(temp > arr[k]) {
                arr[i] = arr[k];
                i = k;
            }
        }
        arr[i] = temp;
    }
}
原文地址:https://www.cnblogs.com/neuzk/p/9487757.html