Apache Hadoop2.0和1.0 - 代码天地

Apache Hadoop2.0和1.0

其他 2020-04-07 08:59:32 阅读次数: 0

http://blog.csdn.net/a2011480169/article/details/53647012

http://hadoop.apache.org/

Apache Hadoop软件库是一个框架，允许使用简单的编程模型跨大型计算机对大型数据集进行分布式处理。它旨在从单个服务器扩展到数千台机器，每台机器都提供本地计算和存储。

Hadoop2.0 项目包括以下模块：

Hadoop Common:用于支持其他Hadoop模块

HDFS：Haddop 分布式文件系统

Hadoop Yarn:作业调度和集群资源管理的框架

HadoopMapReduce用于并行处理大型数据集的基于YARN的系统

Hadoop1.0的HDFS结构如下图所示

Haddop1.0的HDFS是一个主从结构，即一个HDFS集群包含一个NameNode和多个DataNode，如果namenode挂掉，文件的映射关系就没有了

Hadoop1.0的Mapreduce也是一个主从结构，即是一个JobTracker对应多个TaskTracker，JobTracker的工作太多，包括负责用户提交的任务、给TaskTracker分配任务并跟踪

针对上述问题，Hadoop2.0在HDFS和MapReduce上均做了改进

Hadoop2.0引入HDFS联邦和HA机制（待补充）

Hadoop2.0Yarn

Yarn是2.0的资源管理系统

Yarn 基本上就是将Hadoop1.0中的Mapreduce的JobTracker拆分成ResourceManager和每个应用程序特有的AppMaster

ResourceManager：负责整个系统的资源管理和分配

AppMaster:负责任务的分配和监控，每个Job都有一个AppMaster

------------------------------------------------------------------------------待更------------------------------------------------------------------------------------------------------------------

淑芬和二狗

发布了42 篇原创文章 · 获赞 13 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/wangzhanxidian/article/details/74357245

Apache Hadoop2.0和1.0

hadoop1.0和hadoop2.0的区别

Hadoop1.0与Hadoop2.0的区别

hadoop1.0 和hadoop2.0 任务处理架构比较

hadoop2.0 yarn

hadoop2.0安装

hadoop2.0简介

Hadoop 之 Hadoop2.0

apache hadoop

Apache™ Hadoop®

Hadoop2.0学习（一）

Hadoop2.0学习（二）

hadoop2.0的新特性

Hadoop2.0新特性

Apache Hadoop 2.0 Alpha 版发布

Apache Superset 1.0 发布

【Apache】Apache的安装和配置

Hadoop2.0 HA 集群搭建步骤

hadoop2.0配置文件详解

hadoop2.0编译安装步骤

hadoop2.0对命令调用的重构

Hadoop2.0介绍

Hadoop2.0环境安装

hadoop2.0集群搭建

Hadoop2.0安装之YARN

Hadoop2.0之开启日志

Hadoop2.0高可用集群搭建

部署Hadoop2.0高性能集群

Hadoop2.0之YARN组件

Apache License 2.0 协议

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

周排行

决策树的部分理解

STM32软件IIC的实现

RocketMQ原理解析-HA

vue-动态路由（路由的传参和接参）

利用python对Excel中的特定数据提取并写入新表

【Ubuntu】 Ubuntu16.04搭建NFS服务

Elasticsearch基础操作与对应的curl命令行，python对接实现

JVM数据存储结构 & Java的值传递和址传递

yum命令使用指南

java基础（一）：java语法基础

每日归档

更多

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)