大数据面试题---关键问题总结

常见面试题–自身总结:

(同事问的问题,竟然回答的磕磕绊绊,查找资料后补充后补充的答案,后期会继续跟踪补充!!)

1.hbase的二级索引怎样建设
参考:https://blog.csdn.net/wypersist/article/details/79830811
2.hbase的数据倾斜问题怎样解决;
参考: http://student-lp.iteye.com/blog/2309075


3.MapReduce中的数据倾斜问题;
参考:https://blog.csdn.net/WYpersist/article/details/79797075
4.MapReduce中的combine与partation有和区别;
https://blog.csdn.net/mrcharles/article/details/50458637


5.kafka中分区问题;;
https://blog.csdn.net/chizizhixin/article/details/78563595


6.flink的exactly-once怎样保证的??
https://www.jianshu.com/p/9d875f6e54f2
7.flink的滑动窗口?

8.怎样将kafka与spark与hbase串联起来。


(查找的比较好的资料,后期继续补充,未完待续…)

猜你喜欢

转载自blog.csdn.net/fct2001140269/article/details/83154228