RDD是什么?

Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed Datasets,RDD)之上的,这使得 Spark 的各个组件可以无缝地进行集成,能够在同一个应用程序中完成大数据处理。

那什么是RDD呢?详见下图及注释。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/CharlesCFA/article/details/114041060
rdd