21.hadoop系列之Yarn工作机制

Yarn工作机制是面试的重点,需要重点理解学习

  1. MR程序提交到客户端所在的节点
  2. YarnRunner向ResourceManager申请一个Application
  3. RM将该应用程序的资源路径返回给YarnRunner
  4. 该程序将运行所需资源提交到HDFS上
  5. 程序资源提交完毕后,申请运行MRAppMaster
  6. RM将用户的请求初始化成一个Task
  7. 其中一个NodeManager领取到Task任务
  8. 该NodeManager创建容器Container,并产生MRAppMaster
  9. Container从HDFS上拷贝资源到本地
  10. MRAppMaster向RM申请运行MapTask资源
  11. RM将运行MapTask任务分配给另外两个NodeManager,另两个NodeManager分
    别领取任务并创建容器
  12. MR向两个接收到任务的NodeManager发送程序启动脚本,这两个NodeManager分别启动MapTask,MapTask对数据分区排序
  13. MrAppMaster等待所有MapTask运行完毕后,向RM申请容器,运行ReduceTask
  14. ReduceTask向MapTask获取相应分区的数据
  15. 程序运行完毕后,MR会向RM申请注销自己
    欢迎关注公众号算法小生获取更多免费资源

猜你喜欢

转载自blog.csdn.net/SJshenjian/article/details/129335723