第k大的数,前k大的数

1、排序后去出前k个,o(n*log(n))    如果k<log(n),可以考虑直接选择排序,因为只需要执行找到第k个就可以结束 o(n*k)

2、o(nlog(k))快排把数分为了两个部分,所以考虑两个情况,如果大的部分的个数>k,说明只要继续在大的部分找就可以了,

                                                               如果大的部分的个数<k,先把这些数取了,然后继续在小的部分里面找剩下的数(k-大的部分的个数)就可以了。

3、o(nlog((maxv-minv)/delta)),平均为o(nlogn)   转化为找第k个,  假设最大的数为maxv,最小的为minv,那么第k个数必然在[minv,maxv]这个区间中,每次二分这个区间,设mid的数为s,看数组a中比s大的数有没有k大来调整二分,就最后可以得到了。

     如果文件太大,每次统计midv的个数都需要读一次文件,完成一个循环后,把新的区间存入一个新的文件,然后直到新的文件可以放入内存。

while(maxv- minv > delta)
{
    midv = minv + (maxv - minv)*0.5;
    if(f(a,N,midv) >= k) minv = midv;
    else maxv = midv;
}

f(a,N,midv)是找出a数组中比midv大的数的个数

4、维护一个k个数的小顶堆,遍历数组a,然后每次更新小顶堆即可  o(nlog(k))     实际就是堆排序

if(x > h[0])
{
    h[0] = x;
    p,q;
    p = 0;
    while(p < k)
    {
         q = 2*p + 1if(q >= k )break;
         
         if( (q<k-1) && (h[q+1] < h[q]) ) q = q + 1;
         
         if(h[q] < h[p])
         {
               swap(h[q],h[p]);
               p = q;
         }
         else break;
    }
}

     如果k太大不能一次装入内存k个数的堆,那么选一个可以装入内存的数s,第一次找s个,然后找s个。。。直到s*i >k即可。。。但这样要读的数组a的次数就必须增加了。

原文地址:https://www.cnblogs.com/juandx/p/4057118.html