其中,标记星星⭐的是本人的必学包,❤为待选包。
目录
Linux
Hadoop
- Hadoop安装配置
- Hadoop基础知识
- Rhadoop:R语言完成MapReduce 算法,用来替代Java的MapReduce实现。
Hive
Spark
- Spark安装配置
- Spark基础知识
- sparkR: ❤Apache Spark R API
- sparklyr:⭐来自RStudio的Apache Spark的R接口,提供dplyr后端
- PySpark : ❤Apache Spark Python API