Spark:统一分布式大数据分析引擎

LearningSpark

今年早些时候Spark3.0发布,前几天看到Spark学习手册也发布了第二版涵盖Spark3.0功能,想起刚开始学习Spark时就是读的这本书,最近有空就直播读下Spark学习手册第2版这本书,若能帮助到一些人也是好的!
从2020年8月3号每天早上5:30读LearningSpark这本书,如果你想学习大数据学习Spark想早起就可以一起来直播间,如果你错过了直播也可以看视频回放!

第一章 Spark简介:统一的分析引擎

  1. Spark学习手册第二版 LearningSpark2.0 2020080301
  2. LearningSpark之Spark缘起 2020080302
  3. LearningSpark之Google名字的来历 2020080303
  4. LearningSpark之大数据在Yahoo 2020080304

  1. LearningSpark之Spark光芒初露 2020080401
  2. LearningSpark之脱离了大数据的人工智能就是耍流氓 2020080402
  3. LearningSpark之Spark的Speed 2020080403
  4. LearningSpark之Spark的易用模块化易扩展 2020080404

  1. LearningSpark之一统大数据分析 2020080501
  2. LearningSpark之SparkSQL 2020080502
  3. LearningSpark之StructuredStreaming 2020080503
  4. LearningSpark之MLlib 2020080504
  5. LearningSpark之GraphX 2020080505

  1. LearningSpark之服务组件架构 2020080601
  2. LearningSpark之Driver 2020080602
  3. LearningSpark之部署模式yarn client和cluster的区别 2020080603
  4. LearningSpark之分布式数据分片 2020080604

  1. LearningSpark之开发者体验 2020080701
  2. LearningSpark之数据科学家 2020080702
  3. LearningSpark之数据工程师 2020080703
  4. LearningSpark之使用场景和社区发展 2020080704

  1. LearningSpark之下载安装 2020080801
  2. LearningSpark之安装包目录结构 20200802
  3. LearningSpark之使用Scala和PySpark Shell 20200803
  4. LearningSpark之使用本地模式运行 20200804

  1. LearningSpark之需要了解的名词 2020080901
  2. LearningSpark之SparkApplication和SparkSession是什么?2020080902
  3. LearningSpark之什么是转换动作和延迟执行? 2020080903
  4. LearningSpark之什么是宽窄依赖? 2020080904

更新中

我的解读未必正确,请自带脑子观看

猜你喜欢

转载自blog.51cto.com/14256460/2518387
今日推荐