Flink 面试知识点50问

1 Flink基础(适合初入职场)

1.简单介绍一下 Flink
2.Flink相比传统的Spark Streaming区别?
3.Flink的组件栈有哪些?Flink 的运行必须依赖 Hadoop组件吗?
4.你们的Flink集群规模多大?
5.Flink的基础编程模型了解吗?
6.Flink集群有哪些角色?各自有什么作用?
7.说说 Flink 资源管理中 Task Slot 的概念
8.说说 Flink的常用算子?
9.说说你知道的Flink分区策略?
10.Flink的并行度了解吗?
11.Flink的并行度设置是怎样的?
12.Flink的Slot和parallelism有什么区别?
13.Flink有没有重启策略?说说有哪几种?
14.用过Flink中的分布式缓存吗?如何使用?
15.说说Flink中的广播变量,使用时需要注意什么?
16.说说Flink中的窗口?
17.说说Flink中的状态存储?
18.Flink中的时间有哪几类
19.Flink 中水印是什么概念,起到什么作用?
20.Flink Table & SQL 熟悉吗?TableEnvironment这个类有什么作用
21.Flink SQL的实现原理是什么?是如何实现 SQL 解析的呢

2 Flink中级 (适合1~2年开发经验的人)

1.Flink是如何支持批流一体的?
2.Flink是如何做到高效的数据交换的?
3.Flink是如何做容错的?
4.Flink 分布式快照的原理是什么?
5.Flink是如何保证Exactly-once语义的?
6.Flink 的 kafka 连接器有什么特别的地方?
7.说说 Flink的内存管理是如何做的?
8.说说 Flink的序列化如何做的?Flink中的Window出现了数据倾斜,你有什么解决办法?
9.Flink中在使用聚合函数 GroupBy、Distinct、KeyBy 等函数时出现数据热点该如何解决?
10.Flink任务延迟高,想解决这个问题,你会如何入手?
11.Flink是如何处理反压的?
12.Flink的反压和Strom有哪些不同?
13.Operator Chains(算子链)这个概念你了解吗?Flink什么情况下才会把Operator chain在一起形成算子链?
14.说说Flink1.13的新特性?
15.消费kafka数据的时候,如何处理脏数据?

3 Flink高级 (适合3年以上)

1.Flink Job的提交流程
2.Flink所谓"三层图"结构是哪几个"图"?
3.JobManger在集群中扮演了什么角色?
4.JobManger在集群启动过程中起到什么作用?
5.TaskManager在集群中扮演了什么角色?
6.TaskManager在集群启动过程中起到什么作用?
7.Flink 计算资源的调度是如何实现的?
8.简述Flink的数据抽象及数据交换过程?
9.Flink 中的分布式快照机制是如何实现的?
10.简单说说FlinkSQL的是如何实现的?

4.重点

应用架构
压测和监控
有了Spark还为什么用 Flink
checkpoint 的存储exactly-once 的保证状态机制
海量 key 去重
checkpoint 与 spark 比较
watermark 机制
exactly-once 如何实现
CEP
三种时间语义
数据高峰的处理

答案在:
https://www.zhihu.com/search?type=content&q=flink%E9%9D%A2%E8%AF%95%E9%A2%98

猜你喜欢

转载自blog.csdn.net/weixin_43975771/article/details/120764450