一点资讯大数据面试题

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_35468937/article/details/84329648

本人错过了秋招,到了十一月,疯狂的投补招。。。。好多公司简历都挂了

十一月九日电话面试,十一月十二日北京现场面试。

电话一面:
1、自我介绍
hdfs架构、原理
2、MR原理
3、执行MR的过程中,使用了哪些函数?
4、shuffer版本迭代的过程中更新了什么?
5、kafka原理,从生产者生产产品到消费者消费过程是怎样的?
5、flume框架的原理,soure有哪些?sink有哪些?
6、hive如何去重?hive如何行转列?(内置函数)
7、堆空间的内存分配?GC算法?
8、hadoop中Combiner的作用

三点到的公司前台,三点多面试:

现场一面
1、Mr得原理,问的很细,好多Hadoop权威指南上没有讲的内容都问了。可以好好看一下一些大牛写的博客。
2、hql的join,用过没?类似hive的连接查询吧。
3、hive得架构,hbase得架构。
4、自己设计表,写一个查询所有课程的成绩排前二的学生的id
5、手撕代码,遍历二叉树
6、手撕代码,链表的删除添加
一面还有一些记不得了。。。

现场二面。
1、问了storm架构,flume架构。然后实现10亿数据的appid进行pv,uv操作。其中uv去重不要堆机器,设计一个数据结构做出来。
2、10亿得IP,在内存为10M得机器中,统计出top10得ip.(可以使用布隆算法、位图算法(bitmap))
3、给我一张数据库的表,分别有以下字段,用户id,课程id,课程分数。课程是选修课,有的选修的三门,有的选修了四门(每个人选的课程不一样)。请找出所有科目的分数大于80分的用户id

类似下表:


4、手撕代码,叫我使用二分查找找一个数。

没有中间休息,接着轰炸
现场三面
1、来了一个资深面试官吧。来了问了一些常规的问题,学校,自己的编码能力,因为我在心理健康部待过,问过我心理健康方面的东西。我以为是hr在面我,然后,他动笔了。。。
题目和剑指offer中的39题:数组中出现的次数超过一半的数字有点类似。
快排,给了剑指offer中的一个解法。他叫我使用位再想一下。然后手撕代码。。。写完了,说我代码有些小问题,蹭蹭蹭的给我小改了一下。
2、然后又问了一些其他的问题,忘记了。。。

现场四面hr面了
都是性格方面,为什么来北京,薪资,有没有offer等吧,乱七八糟的问题聊了很多。

终于结束了。。。已经晚上接近7点了。已经虚脱了。

猜你喜欢

转载自blog.csdn.net/qq_35468937/article/details/84329648