spark与Hadoop的区别 - 代码天地

spark与Hadoop的区别

其他 2019-08-28 17:21:27 阅读次数: 0

1. Mapreduce和Spark的相同和区别

两者都是用mr模型来进行并行计算
hadoop的一个作业：job
- job分为map task和reduce task，每个task都是在自己的进程中运行的
- 当task结束时，进程也会结束
spark用户提交的任务：application
- 一个application对应一个sparkcontext，app中存在多个job
- 每触发一次action操作就会产生一个job
- 这些job可以并行或串行执行
- 每个job中有多个stage，stage是shuffle过程中DAGSchaduler通过RDD之间的依赖关系划分job而来的
- 每个stage里面有多个task，组成taskset有TaskSchaduler分发到各个executor中执行
- executor的生命周期是和app一样的，即使没有job运行也是存在的，所以task可以快速启动读取内存进行计算。
hadoop的job只有map和reduce操作，表达能力比较欠缺
- 在mr过程中会重复的读写hdfs，造成大量的io操作，多个job需要自己管理关系。
spark的迭代计算都是在内存中进行的
- API中提供了大量的RDD操作如join，groupby等
- 通过DAG图可以实现良好的容错

猜你喜欢

转载自www.cnblogs.com/hdc520/p/11425177.html

Hadoop和Spark的区别

spark和hadoop的区别

Hadoop和Spark区别

spark与Hadoop的区别

Spark Hadoop联系和区别

Hadoop、Storm、Spark的区别与比较

Hadoop和Spark联系与区别

Spark和Hadoop以及区别

Spark是什么？Spark和Hadoop的区别

【Spark】Spark 与 Hadoop MR 之间的区别

hadoop组件---spark----全面了解spark以及与hadoop的区别

Hadoop、MapReduce、YARN和Spark的区别与联系

hadoop和spark的区别介绍

大数据框架hadoop和spark的区别

Hadoop、storm和Spark的区别、比较

秒懂Hadoop和Spark联系与区别

Hadoop，MapReduce，YARN和Spark的区别与联系

Spark和Hadoop的架构区别解读

简单理解Hadoop和Spark的区别

Hadoop与 Spark中的Shuffle之区别与联系

Spark和Hadoop作业之间的区别

1_Hadoop与Alpach Spark的区别(20181218)

大数据框架Spark与Hadoop MR的区别

Hadoop、Spark、Storm、Flink区别及选择

Hadoop -spark

Hadoop & Spark

Hadoop与Spark

Hadoop、Storm和Spark 三者的区别、比较

大数据框架Hadoop和Spark的区别和关系

大数据框架Hadoop和Spark的区别关系

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)