Hadoop dfs目录 - 代码天地

Hadoop dfs目录

其他 2020-06-22 12:51:29 阅读次数: 0

dfs目录位置由core-site.xml文件中 hadoop.tmp.dir 属性决定：hadoop.tmp.dir属性对应值/dfs

1.dfs目录是在NameNode被格式化的时候产生的

　　格式化：首先在停止hadoop之后，删除 hadoop.tmp.dir 属性对应值目录下的所有文件后，执行 hadoop namenode -format 命令

2.dfs目录的子目录：name，data，nameseconds

3.in_use.lock标记当前节点已经在使用，存在于 hadoop.tmp.dir对应值/dfs/name 下

4.HDFS只有在第一启动的时候(后面重启不算，只有第一次)，会默认在1min的时候进行一次合并，即：在1min的时候，edits_inprogress_xxxx 生成 edits_xxxx_xxxx，

　并重新创建edits_inprogress_xxxx文件，之后文件就按照更新条件(主要空间维度和时间维度)进行合并

5.edits文件的开始和结束都会算作一次事务

6.HDFS上传文件：如文件名为aaa.tar.gz

　　a. OP_ADD：在指定目录下创建一个“同名文件._COPING_”，如：“aaa.tar.gz._COPING_”，此时这个文件允许写入

　　b.OP_ALLOCATE_BLOCK_ID：分配BlockID

　　c.OP_SET_GENSTAMP_V2：给时间戳分配一个编号

　　d.OP_ADD_BLOCK：将数据传输到HDFS上

　　e.OP_CLOSE：关闭流，关闭文件，<OVERWRITE>false</OVERWRITE>，即此时文件不允许写入，hdfs的特点：一次写入

　　f.OP_RENAME_OLD：重命名

　　　　<SRC>/aaa.tar.gz._COPYING_</SRC> 原始

　　　　<DST>/aaa.tar.gz</DST> 目标

以上内容需要查看edit文件中内容：将edits文件内容进行转换的命令：hdfs oev -i edits_xxxxxx_xxxxxx -o aaa.xml(转为为xml文件格式，文件名随意)，然后查看aaa.xml文件

7.hdfs oiv -i fsimage_xxxxx -o f.xml -p XML 查看 fsimage文件

8.seen_txid 当前事务ID

9.VERSION 文件，主要的3个参数

　　a.clusterID：集群编号，在NameNode被格式化的时候，自动计算一个clusterID，并且在启动HDFS之后，NameNode会将clusterID分发给每一个DataNode，用于NameNode与DataNode之间的通信管理，NameNode每格式化一次，clusterID都会重新计算。但是在NameNode重启之后，由于DataNode之前已经有了clusterID，故NameNode会存在找不到DataNode的情况，解决方法2种：①将NameNode中的clusterID拷贝到DataNode中 ②将DataNode中的clusterID拷贝到NameNode中

　　b.storageType：节点类型

　　c.blockpoolID：块池ID。主要用于联邦HDFS中

猜你喜欢

转载自www.cnblogs.com/alen-apple/p/13175919.html

Hadoop dfs目录

Hadoop目录

hadoop fs, hdfs dfs, hadoop dfs科普

hadoop fs，hadoop dfs，hdfs dfs

hadoop fs、hadoop dfs与hdfs dfs命令

hadoop fs、hadoop dfs与hdfs dfs的区别

Hadoop：hadoop fs、hadoop dfs与hdfs dfs命令的区别

hadoop之hadoop目录结构

常用hadoop dfs命令

Hadoop——hdfs dfs命令

hadoop集群dfs.data.dir目录权限问题导致节点无法启动

Hadoop执行 hadoop dfs 报错：bash: hadoop: command not found

hadoop源码-目录结构

Hadoop学习目录

hadoop目录导图

hadoop学习笔记-目录

hadoop目录介绍

Hadoop创建目录

hadoop SecondaryNameNode 目录结构

hadoop文件目录详解

Hadoop的目录结构

Hadoop 安装及目录结构

hadoop fs、hadoop dfs与hdfs dfs命令的区别

hadoop fs，hadoop dfs与hdfs dfs之间的区别

hadoop fs、hadoop dfs和hdfs dfs的区别

hadoop之non dfs used

hadoop hdfs dfs基本操作

安装 Hadoop 以及 Hadoop 的目录结构

ma-hadoop脚本命令 hadoop-hadoop dfs-hdfs dfs区别

hadoop fs、hadoop dfs与hdfs dfs命令的区别及hadoop fs命令说明

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)