HDFS读写文件 - 代码天地

HDFS读写文件

其他 2018-11-21 21:33:15 阅读次数: 0

写文件：

client向远程NameNode发起RPC请求；
NameNode检查文件是否存在，成功则为文件创建一个记录；
client根据block size将文件切分成多个packets，并以“data queue”的形式进行管理，另外获取block的replication数；
以pipeline的形式将packets写入所有的replication中，先写入第一个DataNode，该DataNode把packets存储之后，将其传递给pipeline的下一个DataNode，直到最后一个DataNode（流水线形式）；
最后一个DataNode存储成功后返回ack确认，在pipeline中传递到client；
传输过程中某个DataNode故障，则将当前pipeline关闭，移除故障的DataNode，剩余的DataNode仍以pipeline的形式传输，根据replication数量，分配需要的DataNode；
client完成数据的写入之后，调用close()方法，关闭数据流

读文件：

client向远程namenode发起RPC请求；
namenode返回文件的block列表，元数据，DataNode地址等信息；
client选取离它最近的datanode读取block；
读取完当前block之后，关闭DataNode连接，开始读取下一个最佳位置的block；
直到所有数据读取完之后，关闭数据流。

猜你喜欢

转载自blog.csdn.net/quitozang/article/details/82691025

hdfs文件读写

hdfs读写文件过程

HDFS文件读写流程

HDFS读写文件

剖析HDFS的文件读写

HDFS读写文件流程

3.2 HDFS文件读写

读写 HDFS 文件

HDFS文件读写剖析

HDFS 读写文件

hdfs读写文件原理

HDFS系列(4) | HDFS文件读写流程

HDFS中文件的读写操作

HDFS--文件的读写流程

HDFS 读写文件流程详解

HDFS文件的读写操作剖析

hdfs——hadoop文件读写操作

HDFS读写文件的具体流程

图解HDFS读写文件机制

HDFS读写文件流程详解

hadoop笔记-hdfs文件读写

HDFS文件读写流程（二）

HDFS文件读写流程（一）

详解hdfs读写文件流程

python 读写hdfs的txt文件

java实现hdfs文件读写

实验三：HDFS实验&读写HDFS文件&学习使用Java读写HDFS文件

Hadoop笔记：HDFS文件读写流程详解

Hadoop之HDFS文件读写过程

R语言读写HDFS文件内容

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)