从海量数据中查找10个最大值(面试问题) - 代码天地

从海量数据中查找10个最大值(面试问题)

其他 2018-10-11 12:42:02 阅读次数: 0

方法1_使用一个长度为10的基数组(冒泡排序省略):

定义一个长度为10的数组.当每从数组中拿出一个数据,就和长度为10的数组中的最小值进行比较.如果小于最小值,舍弃,否则插入到合适的位置.

伪代码如下:

　　A[N]，a[m]（分别为原始数组和降序数组，其中N=10000，m=10）

　　a = A[0 ... 9]（将数组A的前10个数赋给数组a）

　　sort a（将组数a降序排序）

　　for i in A[ 10 ... N]（从10到N遍历数组A）

　　　　if A[i] > a[9] then （如果当前值比降序数组中的最小值大）

　　　　　　删除a[9]

　　　　　　将A[i]插入a的合适位置，使a保持降序

　　　　end if

　　end for

　　输出数组a

(该方法也可将数组分段读取到内存.)

方法2_使用最小堆

最小堆

最小堆是一种完全二叉树，特点是根节点比两个子节点都小（或者根节点比子节点都大）

过程

先找10个数构建最小堆
依次遍历10亿个数，如果比最小堆的最小值大，则替换这个最小值，并重新构建最小堆
最后输入10个值
时间复杂度
构建最小堆的复杂度为 logn，求出最大m个数会构建m次最小堆，时间复杂度为 m logm，这里m为10000
进行n次时间复杂度为n，这里n为10亿，总时间复杂度为 n m logm，即10亿 10000 log 10000

方法3_其他算法

将十亿个数排序，找出最大值，但是占用空间比较大，做了很多无用功
分治法：将10亿个数分成10份，求出每份的前10000个数，然后在这个10 * 10000 个数中找出最大的10000个数
hash去重复，将这10亿个数的Hash值进行比较，去除重复的

猜你喜欢

转载自blog.csdn.net/zaimeiyeshicengjing/article/details/81435119

从海量数据中查找10个最大值(面试问题)

查找一组数据中的最大值并返回

求10个整数中的最大值

求10 个整数中的最大值

【C语言】求10个整数中的最大值

求10个数中的最大值

查找链表中的最大值

输出10个整数最大值

海量数据处理 - 10亿个数中找出最大的10000个数（top K问题）

js查找json数据中的最大值和最小值方法集结

查找数组中的最大值和最小值

10 个高级 Python 面试问题

mongodb根据子项中的指标查找最小或最大值

算法面试：一亿数据获取前1000个最大值

求10 个整数中最大值

判断10（or N）个实数最大值

求10 个整数中最大值。

C语言：求10 个整数中最大值

【练】求10 个整数中最大值。

.求10 个整数中最大值

求10 个整数中最大值（C语言）

今日代码：求10 个整数中最大值

笔试和面试中的海量数据问题

【算法】面试题——栈的最大值问题

大数据中查找最大10个数---普通查找与堆查找的比较

C语言一行代码实现查找三个数中的最大值

求10个大于等于0且小于等于100的数中的最大值和最小值。

动态数据中求最大值或最小值

100亿个数中找出最大的前K个数（海量数据topK问题）

求个最大值

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)