ElasticSearch集群的故障与恢复机制 - 代码天地

ElasticSearch集群的故障与恢复机制

编程语言 2025-04-08 12:45:22 阅读次数: 0

一、故障转移机制

什么叫做故障转移呢？

集群的master节点会监控集群中的节点状态，如果发现有节点宕机，会立即将宕机节点的分片数据迁移到其它节点，确保数据安全，这个叫做故障转移。

转移过程

下图是正常集群的状态，node1是主节点，其它两个节点是从节点

突然，node1发生了故障，如下图

宕机后的第一件事，需要重新选主，例如选中了node2

node2成为主节点后，会检测集群监控状态，发现：shard-1副本节点、shard-0没有主分片节点，因此需要将node1上的数据迁移到node2、node3

二、节点故障

发生故障前，下面是test7索引库分片以及副本的分布情况

只有一个节点宕机

我们观察下如果三个节点有一个节点宕机了，上文的test7的分片和副本会有哪些变化

首先，我们关闭node-2节点，docker pause node-2

我们可以看到，原本的node-2节点变成了Unassigned，其内部的分片以及副本已经随着节点的宕机而数据丢失了，所以此时集群处于red状态，我们再看看node-1和node-3中，虽然node2宕机了，但是由于我们做了分片与备份，索引仍然可以正常的工作。

事实上，原本在node-2的2号分片移动到了node-1节点，在使用es集群的过程中，一定要注意分片和副本的使用，保证我们整个集群的高可用性

两个节点宕机

由于两个节点宕机，只有一个节点存活，并没有达到集群节点的半数，所以集群应该无法对外提供服务了

我们关闭以下node-3节点看下情况，docker pause node-3

通过Cerebro我们发现整个集群已经无法进行访问了

三、节点恢复

我们先启动node2节点，docker unpause node-2

集群已经能够恢复访问了

此时我们在两个节点可用的情况下创建一个有三分片，两个副本的索引

PUT test8
{
  "settings":{
    "index":{
        "number_of_shards" : "3",
      "number_of_replicas" : "2"
    }
  }
}

如下所示，分片与副本的分布没有问题，有三个副本未分配（因为单个的分片数+副本数<节点总个数）

我们再恢复node-3，docker unpause node-3

所有的未分配副本移动到了node-3节点。

猜你喜欢

转载自blog.csdn.net/qq_46248151/article/details/144507039

ElasticSearch集群的故障与恢复机制

HDFS如何处理故障和节点失效？请解释故障恢复机制。

【基于容器的部署、扩展和管理】3.5 高可用性和故障恢复机制

微服务架构中设计高可用和故障恢复机制

Eclipse撤销恢复机制分享

Spark Streaming的恢复机制——Checkpoint

Fragment的状态保存恢复机制

elasticsearch集群运维监控优化及故障恢复（七）

rabbitmq集群故障恢复

集群的namenode故障恢复

[Kubernetes]容器健康检查和恢复机制

一种简单的nor flash 备份恢复机制

Pod中容器健康检查和恢复机制

Android后台Kill(二)：ActivityManagerService与App现场恢复机制

Linux I2C 总线驱动恢复机制！

Rabbitmq集群故障队列恢复

rabbitmq集群故障恢复详解

elasticsearch 故障恢复的参考 —— 筑梦之路

Activity 和Fragment 的异常销毁、状态保存和恢复机制

Android后台杀死系列之二：ActivityManagerService与App现场恢复机制

浅谈如何保障自建数据库的备份恢复机制

【网络】linux网口bond的链路检测及恢复机制

添加I2c恢复机制导致的死循环

计算机系统的中断恢复机制：超全解析

Mariadb集群故障恢复方法2

Mariadb集群故障恢复方法1

Mariadb集群故障恢复方法3

MySql之MHA集群故障恢复【实战】

mysql数据库集群的故障恢复

MooseFs集群故障恢复运维

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)