简介

纵所周知分布式系统存在各种的问题, 比如机器宕机、网络异常、消息丢失、消息乱序、数据错误、不可靠的TCP、存储数据丢失等故障行为 . 而著名的拜占庭将军问题则描述的了一个最困难的，也是最复杂的一种分布式故障场景, 因为不仅可能存在故障行为，还存在恶意行为.

拜占庭将军问题讲的是有多个将军(节点) 如何就某个作战计划(比如进攻或者撤退)达成共识(一致性)的问题, 将军与将军之间只能通过信使(消息)来通信, 但是在互相通信的过程中可能存在信使被杀(通讯故障或者消息丢失) , 信使被替换(消息被劫持伪造) , 将军叛变(节点被劫持发送错误信息)等问题.

1.2 二忠一叛难题

忠诚的将军的行为: 发送给其他将军的消息是一致的
叛变的将军的行为: 发送给其他将军的消息是不一致的或者相反的
达成共识: 只需要有半数以上将军达成共识即可, 不需要全部.
少数服务多数原则: 一个将军收到消息后按照少数服务多数原则进行投票表决

假设现在只有3个将军, 需要去互相通信统一作战计划达成共识, 并且A和B是忠诚的, C是叛变的情况下会存在什么样的问题?

假设A和B先发送消息, A决定进攻, B决定撤退

在这里插入图片描述
通信后A和B的投票比都是1:1, 这时如果C是忠诚的, 无论它决定进攻还是撤退, 最终A和B的票数比都是进攻[2] : 撤退[1]==》决定进攻 或者都是 进攻[1] : 撤退[2]==》决定撤退, 即两者的目标是一致没问题. 但是如果C是叛变将军, 然后它给A将军发送撤退, 给B将军发送进攻的消息. 这时候问题就很大了, A收到了1个进攻两个撤退最终决定撤退, 而B收到2个进攻, 1个撤退最终决定进攻. 两者没有达成共识, 然后B单枪匹马去进攻被歼灭了.

在这里插入图片描述

1.3 二忠一叛难题的解法1: 口信消息型拜占庭问题之解

通过增加额外的将军参与讨论,并且作为指挥官主导作战指令, 并且增加多轮作战讨论去解决叛变将军的信息干扰

作战规则:

1、增加将军D, 大家事先约定如果没有收到消息，就执行预设的默认命令，比如"撤退".
2、进行两轮作战讨论,
- 第一轮讨论先发送作战信息的将军作为指挥官，其他的将军作为副官；指挥官先单独将他的作战信息发送给每位副官；每位副官，将从指挥官处收到的作战信息作为他的作战指令；如果没有收到作战信息，将把默认的“撤退”作为作战指令。
- 然后在第二轮作战讨论中, 除了第一轮的指挥官外，剩余的3位副官互相给另外2位将军发送作战信息；然后，这3位副官按照“少数服从多数”，执行收到的作战指令。

这时候作战的讨论情况就会出现两种情况:

情况1:忠诚的将军作为指挥官
第一轮作战讨论:

忠诚将军作为指挥官发送一个进攻的指令给3个副官, 理想情况下副官会把该指令作为他的作战指令

第二轮作战讨论:

B、D、C互相给其他副官发送作战指令. B和D按照指挥官的指令发送作战指令, 这时得到的票数比都是 进攻[2] : 撤退[0], 这时候C作为叛军, 无论它发不发指令, 或者给B和D都发送撤退或者给B发送进攻给D发送撤退都好, 它都无法影响B和D的最终决定并且达成共识(都是进攻). 成功解决叛军的干扰.