spark的三大数据结构

RDD:弹性分布式数据集
累加器:分布式共享只写变量
广播变量:分布式共享只读变量

JVM-Driver把数据发送给JVM-Executor,Jvm计算后把结果返回给JVM-Driver

猜你喜欢

转载自blog.csdn.net/qq_44104303/article/details/115006713