hadoop job推测执行 - 代码天地

hadoop job推测执行

编程语言 2018-05-12 19:24:44 阅读次数: 0

什么是推测执行？

所谓的推测执行，就是当所有task都开始运行之后，Job Tracker会统计所有任务的平均进度，如果某个task所在的task node机器配置比较低或者CPU load很高（原因很多），导致任务执行比总体任务的平均执行要慢，此时Job Tracker会启动一个新的任务（duplicate task），原有任务和新任务哪个先执行完就把另外一个kill掉

怎么配置推测执行参数？

推测执行需要设置Job的两个参数：

mapred.map.tasks.speculative.execution

mapred.reduce.tasks.speculative.execution

两个参数的默认值均为true.

推测执行调度策略是什么？

推测执行逻辑：

// 1. Check bottom up for speculative tasks from the running cache

// 2. Check breadth-wise for speculative tasks

// 3. Check non-local tips for speculation

关键逻辑比较执行时间超过平均task执行时间某个百分比，定位为需要推测执行的job

//SPECULATIVE_GAP =0.2
(averageProgress - progress >= SPECULATIVE_GAP ) && (currentTime - startTime >= SPECULATIVE_LAG

P.s. 看源码的时候看到调度map task的策略，故记下。

JobInProgress添加新的maptask的调度策略

// When scheduling a map task:

// 0) Schedule a failed task without considering locality

// 1) Schedule non-running tasks

// 2) Schedule speculative tasks

// 3) Schedule tasks with no location information

map task调度策略：

1、失败的task，不考虑地点

2、没跑过的task

3、推测执行的task

4、nonLocalRunningMaps中的task

猜你喜欢

转载自essen.iteye.com/blog/1844007

hadoop job推测执行

Hadoop 推测执行

Hadoop中任务推测执行

Hadoop MapReduce Job执行过程源码跟踪

hadoop学习1——job执行过程

job on hadoop

Hadoop执行job出错：java.lang.ClassCastException

Hadoop执行Job时报DiskChecker$DiskErrorException异常原因

hadoop集群 yarn 执行job的时候 nodemanager 获取不到cpu

Hadoop Job Tuning

Hadoop Job失败解决

Hadoop First Job

hadoop命令---job相关

hadoop job kill

hadoop 管理job

hadoop的job分发机制

spark推测执行的坑

任务的推测执行

spark之推测执行

MapReduce任务的推测执行

Spark 推测执行

Spark 推测执行(speculative)

hadoop JOB的性能优化实践

Including external jars in a Hadoop job

hadoop之MR Job案例

Hadoop多Job并行处理

Hadoop执行Job时因超时自动kill原因及解决方案

【Hadoop-2.7 源码系列】0-WordCount 解析及整个MR Job的执行流程介绍

Hadoop-job作业执行流程+MapReduce实现手机流量统计

Hadoop——MR执行环境

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)