大数据系列（1）Hadoop是什么？ - 代码天地

大数据系列（1）Hadoop是什么？

其他 2020-04-15 22:16:47 阅读次数: 0

Hadoop

Hadoop是一个开源的大数据框架
Hadoop是一个分布式计算的解决方案
Hadoop=HDFS（分布式文件系统）+ MapReduce（分布式计算）

Hadoop核心

HDFS分布式文件系统：存储是大数据技术的基础
MapReduce编程模型：分布式计算时大数据应用的解决方案

HDFS

普通的成百上千的机器
按TB甚至PB为单位的大量的数据
简单便捷的文件获取

Hadoop基础架构

HDFS概念

数据块
NameNode
DataNode

数据块

数据块是抽象块而非整个文件作为存储单元，默认大学为64MB，一般设置为128M，备份*3
在这里插入图片描述

NameNode

管理文件系统的命名空间，存放文件元数据
维护着文件系统的所有文件和目录，文件与数据块的映射
记录每个文件中各个块所在数据节点的信息

DataNode

存储并检索数据块
向NameNode更新所存储块的列表

HDFS优点

适合大文件存储，支持TB，PB级的数据存储，并有副本策略
可以构建在廉价的机器上，并有一定的容错和恢复机制
支持流失数据访问，一次写入，多次读取最高效

HDFS缺点

不适合大量小文件存储
不适合并发写入，不支持文件随机修改
不支持随机读等低延时的访问方式
两个问题
数据块的大小设置为多少是合适，为什么？
NameNode有哪些容错的机制，如果挂掉了怎么办?

GitCloud

发布了35 篇原创文章 · 获赞 3 · 访问量 3300

私信关注

猜你喜欢

转载自blog.csdn.net/qq_43430261/article/details/105529172

大数据系列（1）Hadoop是什么？

初识大数据（二. Hadoop是什么）

hadoop是什么？学习大数据干货分享

大数据是什么

大数据是什么？

大数据是什么?

【大数据】什么是hadoop

【大数据开发笔记1】什么是Hadoop?

大数据之hadoop / hive / hbase 的区别是什么？有什么应用场景？

漫谈大数据---大数据是什么

大数据是什么？大数据的趋势？

大数据之是什么?

大数据工具是什么？

大数据的意义是什么？

大数据技术学习路线指南：[1]大数据是什么

大数据是什么？1分钟了解大数据的概念！

什么是Hadoop？大数据与Hadoop简介

运行一个 hadoop 任务的流程是什么样的（大数据开发面试）

都要说大数据很火，但是你知道他中的Hadoop是什么吗

如何形象的比喻描述大数据的技术生态？Hadoop、Hive、Spark之间是什么关系？

你知道Hadoop在大数据中的关键性作用是什么吗？

郑州大数据学习路线是什么 Hadoop有哪些阶段

大数据的技术生态？Hadoop、Hive、Spark之间是什么关系？

大数据开发技术生态Hadoop、Hive、Spark之间是什么关系

大数据学习路线是什么 Hadoop学习有哪些阶段

大数据核心重点是什么怎么掌握Hadoop运行原理

Hadoop是什么？学习大数据的第一步

描述大数据的技术生态？Hadoop、Hive、Spark 之间是什么关系

Hadoop系列之什么是Hadoop(1)

【大数据】如何用形象的比喻描述大数据的技术生态？Hadoop、Hive、Spark 之间是什么关系？

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)