Hadoop——简介 - 代码天地

Hadoop——简介

其他 2018-08-09 14:06:43 阅读次数: 0

Hadoop起源于Nutch项目。我们几个人有一段时间一直在尝试构建一个开源的Web搜索引擎，但始终无法有效地将计算任务分配到多台计算机上，几十就只是屈指可数的几台。知道谷歌发表了GFS和MapReduce的相关论文之后我们的思路才清晰起来。他们设计的系统已经可以精准地解决我们在Nutch项目中面临的困境。于是，我们开始尝试重建这些系统，并将其作为Nutch的一部分。后台，我们终于让Nutch可以在20台机器上平稳运行了，但很快又意识到一点：要想应对大规模的Web数据计算，还必须得让Nutch能在几千台机器上运行，不过这个工作远远不是两个半天工作制的开发人员能搞定的。差不多就在这个时候，雅虎也对这项技术产生了浓厚的兴趣并迅速组建了一个开发团队。我有幸成为其中一员。我们剥离出Nutch的分布式计算模块，将其称为”Hadoop”。在雅虎的帮助下，Hadoop很快就能够真正处理海量的Web数据了 ———— Doug Cutting

hadoop发展历程

这里写图片描述

hadoop版本更迭

这里写图片描述

hadoop基本模块

模块	解释
HDFS	Hadoop的分布式文件系统
MapReduce	Hadoop的数据处理编程模型
YARN	Hadoop的集群资源管理系统

hadoop生态系统

这里写图片描述

猜你喜欢

转载自blog.csdn.net/weixin_37490221/article/details/80906507

hadoop 简介

Hadoop简介

Hadoop的简介

Hadoop——简介

Hadoop简介！

Hadoop系列——Hadoop简介

hadoop学习（一）---hadoop简介

Hadoop（一）Hadoop的简介与安装

Hadoop详解（一）：Hadoop简介

hadoop基础----hadoop理论----Hadoop简介

hadoop_rpc简介

Hadoop项目简介

Hadoop（HDFS）简介

hadoop_ssh简介

Hadoop产品简介

Spring for hadoop 简介

Hadoop开发环境简介

Hadoop 入门简介

[Hadoop] 简介及集群搭建

Hadoop系列之简介

hadoop家族简介

Hadoop简介及HDFS

大数据与Hadoop简介

2.1 Hadoop简介

hadoop2.0简介

Hadoop之MapReduce简介

Hadoop初步简介

hadoop(八)、hive简介

01Hadoop简介

Hadoop flume简介

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)