（三）hadoop学习之HDFS简介 - 代码天地

（三）hadoop学习之HDFS简介

其他 2018-10-10 19:54:32 阅读次数: 0

Hadoop - HDFS

简介

Hadoop Distributed File System，分布式文件系统

结构

block:

1.数据存储的基本单位，一般情况为64M

2.大文件会被拆分成块，存储于不同机器，如果文件大小低于block大小，那么block大小为实际文件大小

3.读写操作，每次读写一个block

3.block会被复制到多个机器上(Replication)

NameNode:

1.存储文件的元数据信息（metadata），比如命名空间信息，块信息等。当它运行的时候，这些信息是存在内存中的。。整个HDFS可以存储的文件数目取决于NameNode内存的大小

2.每个block在NameNode中对应一条记录，大小一般为150字节，如果有大量小文件，那么会消耗大量内存。同时MapReduce处理大量小文件会产生大量的map task，线程管理开销将会增加作业时间。所以建议存储大文件

3.定时持久化到磁盘上，但是不会保存block的位置信息，DataNode注册时上报和运行时维护

4.如果NameNode失效，整个HDFS都失效

Secondary NameNode:

听起来像是NameNode的备份，实则不然。

看图：

fsimage - 它是在NameNode启动时对整个文件系统的快照
edit logs - 它是在NameNode启动后，对文件系统的改动序列

如图，当NameNode启动时，会把改动序列edit logs 合并进fsimage中，从而得到一个最新的文件系统快照，但是实际上NameNode很少重启，那么一旦NameNode崩溃，所有改动都会丢失。这时候secondary NameNode作用体现了，你可以把它当做一个NameNode的监听器，会定时读取NameNode的edit logs 一旦有更新，他会更新fsImage（secondary NameNode自己的fsimage），一旦发现改动，他会把改动拷贝到NameNode中

DataNode:

保存具体的block数据
负责数据的读写操作和复制操作
DataNode启动时会向NameNode报告当前存储的数据块信息，后续也会定时报告修改信息
DataNode之间会进行通信，复制数据块，保证数据的冗余性

猜你喜欢

转载自blog.csdn.net/zhang_zhongkang/article/details/82252136

（三）hadoop学习之HDFS简介

hadoop学习之——hdfs

hadoop详细文档(三) hadoop之HDFS简介(附带详细讲解视频)

hadoop学习笔记<三>----HDFS

Hadoop系列之HDFS 简介(8)

学习Hadoop——HDFS 文件系统简介

Hadoop学习笔记之HDFS

Hadoop学习之安装HDFS

hadoop学习之HDFS原理

Hadoop（HDFS）简介

Hadoop简介及HDFS

Hadoop(三)之HDFS简单介绍

Hadoop三大组件之HDFS

hadoop学习(三) HDFS 的 java 访问接口

【Hadoop学习之HDFS】_12HDFS之DataNode

hadoop学习笔记之三：hadoop hdfs fs 指令学习

Hadoop学习笔记5之HDFS Block

Hadoop学习之HDFS的相关操作

【Hadoop学习之HDFS】_06HDFS的shell操作

【Hadoop学习之HDFS】_04HDFS的优缺点

【Hadoop学习之HDFS】_08HDFS的API操作

【Hadoop学习之HDFS】_05HDFS文件块大小

【Hadoop学习之HDFS】_10HDFS的数据流

Hadoop系列（二）Hadoop三大核心之HDFS基础

（二）hadoop学习之Hadoop 简介

Hadoop 学习总结之一：HDFS简介(转)

Hadoop 学习总结之一：HDFS简介（转载）

Hadoop学习三：Hadoop-Hdfs物理文件夹

Hadoop学习01之HDFS&Hadoop集群搭建

hadoop之hdfs

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)