block locality - 代码天地

block locality

其他 2020-01-19 19:07:33 阅读次数: 0

因为DataNode和RegionServer通常会部署在相同的机器上，所以会产生Locality这样的概念。

HBase的Locality是通过HDFS的Block复制实现的。在复制Block时，HBase是这样选择副本的位置的：

第一个副本写到本地节点上；
第二个副本写到另一个机架的随机节点上；
第三个副本写到相同机架的一个随机选择的其他节点上；
如果还有更多的副本，这些副本将会写到集群上的随机节点上。

就是这样，在flush或compact后，HBase的Region实现了Locality。

当一个RegionServer处在failover的情况下（rebalance或重启）时，可能会分配到一些没有本地StoreFiles的Region（因为此时没有可用的本地副本）。然而，有新数据再写入这些Region的时候，或者是对表进行compact的时候，StoreFiles将会被重写，这些Region也会再次变成RegionServer的“local”Region。

有一个相关的指标“data locality”，即Region保存在本地的StoreFile的百分比。

其实我的理解是：一个region是一张表，在某一台机器上的的一部分数据。但是这应该是一个逻辑上的概念，一个region会有多个HStore（列族），一个HStore下面会有多个hfile。这些hfile才是真的存储的文件，这些hfile都是在hdfs上以block存储的，这些block可能在不同的机器上，这就有了本地化率这个概念。

datanode和 regionserver 一般都部署在同一台机器上，所以region server 管理的 region 会优先存储在本地，以节省网络开销。如果 block locality 较低有可能是刚做过 balance或刚重启，经过compact 后region 的数据都会写到当前机器的 datanode，block locality 也会慢慢达到接近 100。

也就是说本地化率低，可以通过compaction来提升本地化率。

龙骨

发布了131 篇原创文章 · 获赞 79 · 访问量 31万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_31780525/article/details/101068977

block locality

《在路上 …》 Locality Sensitive Hash

spark - Locality Level

block

__block

Locality Sensitive Hashing原理与实现

【论文阅读】Cache locality is not enough

Locality Sensitive Hashing（局部敏感哈希）

LSH(Locality Sensitive Hashing)原理与实现

局部敏感哈希-Locality Sensitivity Hashing

Locality Sensitive Hashing(局部敏感哈希)

CDN笔记一 Locality Sensitive Hashing算法

局部敏感哈希算法(Locality Sensitive Hashing)

Locality-Driven Dynamic GPU Cache Bypassing

cbam block and senet block

Block本质及__block本质

Block - __weak、__block的使用

Learning color and locality cues for moving object detection and segmentation方法解析

局部敏感哈希（Locality Sensitive Hashing）和MinHash介绍与实例

局部敏感哈希(Locality-Sensitive Hashing, LSH)方法介绍

局部敏感哈希(Locality sensitive hash) —— 代码篇

局部敏感哈希（Locality Sensitive Hashing）二三问

SPARK 数据本地化（spark.locality.wait）

HBase基于region数目和data locality来balance regions

CDN笔记二 Locality Sensitive Hashing算法续

Spark笔记之数据本地性（data locality）

论文笔记·流形学习：Locality Preserving Projections

基于LSH的目标追踪（Visual Tracking via Locality Sensitive Histograms）

HBase Locality 为什么介于0~1之间？

【机器学习】局部保留投影(Locality Preserving Projection, LPP)

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)