Elasticsearch核心技术与实战学习笔记 39 | 文档分布式存储 - 代码天地

Elasticsearch核心技术与实战学习笔记 39 | 文档分布式存储

其他 2020-06-27 10:08:20 阅读次数: 0

一序

本文属于极客时间Elasticsearch核心技术与实战学习笔记系列。

二文档储存在分片上

文档会存储在具体的某个主分片和副本分片上：例如文档 1，会储存在 P0 R0 分片上
文档到分片的映射算法

确保文档能均匀分布在所用分片上，充分利用硬件资源，避免部分机器空闲，部门机器繁忙
潜在的算法

随机 / Round Robin. 当查询文档 1，分片数很多，需要多次查询才能查档文档 1
维护文档到分片的映射关系，当文档数据量大的时候，维护成本高
实时计算，通过文档 1，自动算出，需要去哪个分片上获取文档.

这里ES采用的就是方案3

2.1 文档到分片的路由算法

shard = hash(_routing) % number_of_primary_shards

Hash 算法确保文档均匀分散到分片中
默认的_routing 值是文档 id
可以自行制定 routing 数值，例如用相同国家的商品，都分配到制定的 shard
设置 Index Setting 后，Primary 数，不能随意修改的根本原因

2.2 更新文档

顺序： index -> hash -> route -> delete -> index -> success -> response

1, 用户发出update请求，第一个节点是Coordinating Node，他通过hash计算算出文档对应分片，路由到这个分片。

更新是执行的两步，先删除再创建。成功后返回一个success给Coordinating Node，Coordinating Node再返回response

2.3删除一个文档

顺序：detele -> hash&route -> delete -> delete replica -> success -> deleted -> response

跟更新类似，多了删除副本的流程。

扫描二维码关注公众号，回复： 11373714 查看本文章

补充知识点：

可以设置 Index Settings ，控制数据的分片
Primary Shard 的值不能修改，修改需要重新 Index。
索引写入数据后，Replica 值可以修改。增加副本，可提高大并发下的读取性能
通过控制集群的节点数，设置 Primary Shard 数，实现水平扩展

猜你喜欢

转载自blog.csdn.net/bohu83/article/details/106960807

Elasticsearch核心技术与实战学习笔记 39 | 文档分布式存储

Elasticsearch 分布式文档存储

ElasticSearch（四）--分布式文档存储

ElasticSearch分布式文档存储介绍

Elasticsearch核心技术与实战学习笔记 41 | 剖析分布式查询及相关性算分

Elasticsearch核心技术与实战学习笔记 37 | 集群分布式模型及选主与脑裂问题

Elasticsearch核心技术与实战学习笔记 50 | 文档的父子关系

Elasticsearch（十）elasticsearch分布式文档存储

elasticsearch 基础 —— 分布式文档存储原理

Elasticsearch核心技术与实战学习笔记第三章 11 | 文档的基本CRUD与批量操作

系统架构设计笔记（39）—— 简单分布式系统设计

39学习分布式计算框架 Hadoop 的高可用方案，如 NameNode 集群、ZooKeeper

分布式存储笔记

ElasticSearch 学习08 - 分布式文档存储（wait_for_active_shards新参数分析）

ElasticSearch 5学习——分布式文档存储（wait_for_active_shards新参数分析）

Elasticsearch核心技术与实战学习笔记第三章 19 | 显式Mapping设置与常见参数介绍

Elasticsearch核心技术与实战-学习笔记

Elasticsearch核心技术与实战学习笔记

分布式核心技术

Ceph分布式存储学习笔记

ceph分布式存储实战

分布式存储技术及应用

主流分布式存储技术对比

ElasticSearch 学习记录之分布式文档存储往ES中存数据和取数据的原理

39、集群部署时的分布式session如何实现？

GlusterFS分布式存储学习笔记 GlusterFS分布式存储学习笔记

LLVM学习笔记（39）

leetcode学习笔记39

Elasticsearch学习: 分布式文档路由原理

【linux技术】分布式存储技术实战演练

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)