Hadoop权威指南系列学习-关于HDFS - 代码天地

Hadoop权威指南系列学习-关于HDFS

其他 2019-11-27 10:01:03 阅读次数: 0

HDFS的设计

　　Hadoop自带一个称为HDFS的分布式文件系统，即Hadoop Distributed FileSystem。在非正式文档或旧文档以及配置中心中，有时也简称为DFS

数据块

　每个磁盘都有默认的数据块大小，这是磁盘进行数据读/写的最小单位。构建与单个磁盘之上的文件系统通过磁盘块来管理该文件系统中的块。该文件系统块的大小可以是磁盘块的整数倍。

　HDFS同样也有块（block）的概念，但是大得多，默认为128MB。与单一磁盘上的文件系统相似，HDFS上的文件也被花费为块大小的多个分块（chunk），作为独立的存储单元。

　好处：

　　1.一个文件的大小可以大于网络中任意一个磁盘的容量。文件的所有块并不需要存储在同一个磁盘上，因此他们可以利用集群上的任意一个磁盘进行存储。

　　2.使用抽象块而非整个文件作为存储单元，大大简化了存储子系统的设计。

　　3.块还非常适合用于数据备份进而提供数据容错能力和提高可用性。将每个块复制到少数几个物理上相互独立的机器上（默认为3个），可以确保在块、磁盘或机器发生故障后数据不会丢失。如果发现一个块不可用，系统会从其他地方读取另一个副本，而这个过程对用户是透明的

　　HDFS中fsck指令可以显示块信息。执行以下命令将列出文件系统中各个文件由哪些块构成

　　hdfs fsck / -files -blocks

namenode 和 datanode

　　HDFS 集群有两类节点以管理节点-工作节点模式运行，即一个namenode（管理节点）和多个datanode（工作节点）。namenode管理文件系统的命名空间。它维护者文件系统树及整棵树内所有的文件和目录。这些信息以两个文件形式永久保存在本地磁盘上：命名空间镜像文件和编辑日志文件

　　　　

猜你喜欢

转载自www.cnblogs.com/kingyoung/p/11930325.html

Hadoop权威指南系列学习-关于HDFS

Hadoop权威指南系列学习-关于MapReduce

《Hadoop权威指南》---关于MapReduce

《Hadoop权威指南》学习笔记（一）

《Hadoop权威指南》学习笔记（零）

《Hadoop权威指南》学习笔记（二）

一、Hadoop权威指南学习图谱

《Hadoop权威指南》学习笔记（四）

《Hadoop权威指南》学习笔记（三）

学习Hadoop权威指南之Hadoop运行MapReduce日志查看

学习Hadoop权威指南之MapReducer气象数据分析

《Hadoop 权威指南 - 大数据的存储与分析》学习笔记

《Hadoop Yarn权威指南》学习笔记（一）——Yarn架构

《Hadoop Yarn权威指南》学习笔记（零）——Yarn核心概念

Hadoop权威指南学习笔记：总章（未完结）

《Hadoop权威指南（第四版英文版）》—— HDFS学习笔记

学习javascript权威指南系列

跟我一起读《Hadoop权威指南》第四篇 -- 关于Yarn

跟我一起读《Hadoop权威指南》第三篇 -- HDFS （Hadoop分布式文件系统）

Git权威指南-学习

es权威指南学习

学习hive权威指南

迟来的学习之<Hadoop 权威指南第三版>笔记

hadoop权威指南学习(一) - 天气预报MapReduce程序的开发和部署

Hadoop 权威指南

hadoop权威指南

《Hadoop权威指南第4版》 - 第四章关于YARN - hadoop的集群资源管理系统

《Hadoop权威指南》---初识Hadoop

Kakfa权威指南系列文章

elasticsearch权威指南学习3

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)