面试中常被问到的TopK问题

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Somnus_k/article/details/82724704

面试过程中,经常会遇到面试官问你,给你40亿个数,找出其中最大的100个数。

参考:https://www.cnblogs.com/en-heng/p/6336625.html

解决Top K问题有两种思路:

1.最直观:小顶堆(大顶堆 -> 最小100个数)

维护一个100个数的小根堆,从101个数开始,每次与堆顶元素相比,如果比堆顶元素大,就将堆顶元素替换掉,然后重新调整堆,这样可以每次比较将堆中最小的元素淘汰掉,遍历完40亿个数后,堆中存在的100个数即为40亿中最大的100个数。主要借助于堆,代码略了。

2.较高效:Quick Select算法。

Quick Select算法类似于快排,通过枢轴,将数组分为两部分,左边元素都大于等于枢轴,右边元素都小于等于枢轴,如果左边元素个数刚好等于k个,那左边这些元素就是TopK元素,如果左边元素个数大于k个,则将范围缩小,继续寻找TopK;如果左边元素个数小于k个,设为m,则在右边元素中寻找Top(k-m)即可。

Quick Select的Java实现如下:

public int findKthLargest(int[] nums, int k) {
  return quickSelect(nums, k, 0, nums.length - 1);
}

// quick select to find the kth-largest element
public int quickSelect(int[] arr, int k, int left, int right) {
  if (left == right) return arr[right];
  int index = partition(arr, left, right);
  if (index - left + 1 > k)
    return quickSelect(arr, k, left, index - 1);
  else if (index - left + 1 == k)
    return arr[index];
  else
    return quickSelect(arr, k - index + left - 1, index + 1, right);

}

上面给出的代码都是求解第k大元素;若想要得到Top K元素,仅需要将代码做稍微的修改:比如,扫描完成后的小顶堆对应于Top K,Quick Select算法用中间变量保存Top K元素。

猜你喜欢

转载自blog.csdn.net/Somnus_k/article/details/82724704
今日推荐