RabbitMQ集群配置

配置集群前须知

主机名解析

RabbitMQ节点使用域名相互寻址,因此所有集群成员的主机名必须能够从所有集群节点解析,可以修改hosts文件或者使用DNS解析

如果要使用节点名称的完整主机名(RabbitMQ默认为短名称),并且可以使用DNS解析完整的主机名,则可能需要调查设置环境变量  RABBITMQ_USE_LONGNAME = true

创建集群的方法用多种

  通过配置文件

  rabbitmqctl手动配置

  通过插件(如:AWS(EC2)实例发现,Kubernetes发现,基于Consul的发现,基于etcd的发现)

一个集群的组成可以动态改变,所有的RabbitMQ开始作为单个节点运行,这些节点可以加入到集群,然后也可以再次脱离集群转回单节点

RabbitMQ集群可以容忍单个节点的故障。节点可以随意启动和通知,只要它们可以与在关闭时已知的集群成员节点联系

集群意味着在局域网使用,不建议运行跨广域网的集群

节点可以是disk节点或RAM节点

RAM节点将内部数据库表存储在RAM中。这不包括消息,消息存储索引,队列索引和其他节点状态
在90%以上的情况下,您希望所有节点都是磁盘节点; RAM节点是一种特殊情况,可用于改善高排队,交换或绑定流失的性能集群。RAM节点不提供有意义的更高的消息速率。如有疑问,请仅使用磁盘节点。
由于RAM节点仅将内部数据库表存储在RAM中,因此它们必须在启动时从对等节点同步它们。这意味着群集必须至少包含一个磁盘节点。因此无法手动删除集群中剩余的最后一个磁盘节点

rabbitmqctl配置集群

hostname ip system RabbitMQ
rabbit1 192.168.88.1 CentOS7.2.1511 3.7.0
rabbit2 192.168.88.2    
rabbit3 192.168.88.3    

绑定hosts文件

192.168.88.1 rabbit1
192.168.88.2 rabbit2
192.168.88.3 rabbit3

在三台机器安装RabbitMQ

RabbitMQ安装教程

设置节点互相验证:Erlang Cookie

RabbitMQ节点和CLI工具(例如rabbitmqctl)使用cookie来确定它们是否被允许相互通信,要使两个节点能够通信,它们必须具有相同的共享密钥,称为Erlang Cookie.
Cookie只是一个字符串,最多可以有255个字符。它通常存储在本地文件中。该文件必须只能由所有者访问(400权限)。每个集群节点必须具有相同的 cookie,文件位置/var/lib/rabbitmq/.erlang.cookie, 把rabbit2、rabbit3设置成和rabbit2一样的即可,权限是400

正常方式启动所有节点

1

2

3

rabbitmq-server -detached

rabbitmq-server -detached

rabbitmq-server -detached

现在启动了三个独立的RabbitMQ,我们用cluster_status命令查看集群状态

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

[root@rabbit1 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit1 ...

[{nodes,[{disc,[rabbit@rabbit1]}]},

 {running_nodes,[rabbit@rabbit1]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit1,[]}]}]

[root@rabbit2 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit2 ...

[{nodes,[{disc,[rabbit@rabbit2]}]},

 {running_nodes,[rabbit@rabbit2]},

 {cluster_name,<<"rabbit@rabbit2">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit2,[]}]}]

  

[root@rabbit3 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit3 ...

[{nodes,[{disc,[rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit3]},

 {cluster_name,<<"rabbit@rabbit3">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit3,[]}]}]

为了连接集群中的三个节点,我们把rabbit@c2和rabbit@c3节点加入到rabbit@c1节点集群

首先,在rabbit@c1的簇中加入rabbit@c2

  1、停止rabbir@c2的rabbitmq应用程序,

  2、加入rabbit@c1集群

  3、然后启动RabbitMQ程序

注意:加入集群会隐式重置节点,从而删除此节点上以前存在的所有资源和数据

1

2

3

4

5

6

7

8

9

[root@rabbit2 ~]# rabbitmqctl stop_app

Stopping rabbit application on node rabbit@rabbit2 ...

[root@rabbit2 ~]# rabbitmqctl join_cluster rabbit@rabbit1

Clustering node rabbit@rabbit2 with rabbit@rabbit1

[root@rabbit2 ~]# rabbitmqctl start_app

Starting node rabbit@rabbit2 ...

 completed with 0 plugins.

现在我们在rabbit1、rabbit2任意一个节点上查看集群状态,我们可以看到这两个节点加入了一个集群

1

2

3

4

5

6

7

[root@rabbit1 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit1 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2]}]},

 {running_nodes,[rabbit@rabbit2,rabbit@rabbit1]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit2,[]},{rabbit@rabbit1,[]}]}]

我们再把rabbit3节点加入到这个集群

1

2

3

4

5

6

7

8

9

[root@rabbit3 ~]# rabbitmqctl stop_app

Stopping rabbit application on node rabbit@rabbit3 ...

[root@rabbit3 ~]# rabbitmqctl join_cluster rabbit@rabbit1

Clustering node rabbit@rabbit3 with rabbit@rabbit1

[root@rabbit3 ~]# rabbitmqctl start_app

Starting node rabbit@rabbit3 ...

 completed with 0 plugins.

通过任何节点上的cluster_status命令,我们可以看到这三个节点加入了一个集群

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

[root@rabbit1 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit1 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit3,rabbit@rabbit2,rabbit@rabbit1]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit3,[]},{rabbit@rabbit2,[]},{rabbit@rabbit1,[]}]}]

[root@rabbit2 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit2 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit3,rabbit@rabbit1,rabbit@rabbit2]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit3,[]},{rabbit@rabbit1,[]},{rabbit@rabbit2,[]}]}]

[root@rabbit3 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit3 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit1,[]},{rabbit@rabbit2,[]},{rabbit@rabbit3,[]}]}]

通过遵循上述步骤,我们可以在集群正在运行的同时随时向集群添加新节点

已加入群集的节点可随时停止。他们也可以崩溃。在这两种情况下,群集的其余部分都会继续运行,并且节点在再次启动时会自动“跟上”(同步)其他群集节点。

我们关闭rabbit@rabbit1和rabbit@rabbit3,并检查每一步中的集群状态

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

[root@rabbit1 ~]# rabbitmqctl stop

Stopping and halting node rabbit@rabbit1 ...

[root@rabbit2 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit2 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit3,rabbit@rabbit2]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit3,[]},{rabbit@rabbit2,[]}]}]

  

[root@rabbit3 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit3 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit2,rabbit@rabbit3]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit2,[]},{rabbit@rabbit3,[]}]}]

  

 [root@rabbit3 ~]# rabbitmqctl stop

Stopping and halting node rabbit@rabbit3 ...

[root@rabbit2 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit2 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit2]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit2,[]}]}]

 现在我们再次启动节点,在我们继续检查集群状态时

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

[root@rabbit3 ~]# rabbitmq-server -detached

[root@rabbit3 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit3 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit2,rabbit@rabbit3]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit2,[]},{rabbit@rabbit3,[]}]}]

[root@rabbit2 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit2 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit3,rabbit@rabbit2]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit3,[]},{rabbit@rabbit2,[]}]}]

[root@rabbit1 ~]# rabbitmq-server -detached

[root@rabbit1 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit1 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit2,rabbit@rabbit3,rabbit@rabbit1]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit2,[]},{rabbit@rabbit3,[]},{rabbit@rabbit1,[]}]}]

[root@rabbit2 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit2 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit1,rabbit@rabbit3,rabbit@rabbit2]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit1,[]},{rabbit@rabbit3,[]},{rabbit@rabbit2,[]}]}]

[root@rabbit3 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit3 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit1,rabbit@rabbit2,rabbit@rabbit3]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit1,[]},{rabbit@rabbit2,[]},{rabbit@rabbit3,[]}]}]

一些重要的警告:
当整个集群关闭时,最后一个关闭的节点必须是第一个要联机的节点。
如果要脱机的最后一个节点无法恢复,可以使用forget_cluster_node命令将其从群集中删除
如果所有集群节点同时停止并且不受控制(例如断电),则可能会留下所有节点都认为其他节点在其后停止的情况。在这种情况下,您可以在一个节点上使用force_boot命令使其再次可引导

集群移除节点

当节点不再是节点的一部分时,需要从集群中明确地删除节点。我们首先从集群中删除rabbit@rabbit3,并将其返回到独立操作

在rabbit@rabbit3上:

  1、我们停止RabbitMQ应用程序,

  2、重置节点

  3、重新启动RabbitMQ应用程序

1

2

3

4

5

6

7

8

9

[root@rabbit3 ~]# rabbitmqctl stop_app

Stopping rabbit application on node rabbit@rabbit3 ...

[root@rabbit3 ~]# rabbitmqctl reset

Resetting node rabbit@rabbit3 ...

[root@rabbit3 ~]# rabbitmqctl start_app

Starting node rabbit@rabbit3 ...

 completed with 0 plugins.

在节点上 运行cluster_status命令确认rabbit@rabbit3现在不再是集群的一部分并独立运行

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

[root@rabbit3 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit3 ...

[{nodes,[{disc,[rabbit@rabbit3]}]},

 {running_nodes,[rabbit@rabbit3]},

 {cluster_name,<<"rabbit@rabbit3">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit3,[]}]}]

  

[root@rabbit1 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit1 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2]}]},

 {running_nodes,[rabbit@rabbit2,rabbit@rabbit1]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit2,[]},{rabbit@rabbit1,[]}]}]

[root@rabbit2 ~]# rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit2 ...

[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2]}]},

 {running_nodes,[rabbit@rabbit1,rabbit@rabbit2]},

 {cluster_name,<<"rabbit@rabbit1">>},

 {partitions,[]},

 {alarms,[{rabbit@rabbit1,[]},{rabbit@rabbit2,[]}]}]

我们也可以远程删除节点,例如,在处理无响应的节点时,这很有用
比如:我们在节点rabbit@rabbit2上把rabbit@rabbit1从集群中移除

1

2

3

4

5

[root@rabbit1 ~]# rabbitmqctl stop_app

Stopping rabbit application on node rabbit@rabbit1 ...

[root@rabbit2 ~]# rabbitmqctl forget_cluster_node rabbit@rabbit1

Removing node rabbit@rabbit1 from the cluster

请注意,rabbit1仍然认为它与rabbit2集群 ,并试图启动它将导致错误。我们需要重新设置才能重新启动。

1

2

3

4

5

6

[root@rabbit1 ~]# rabbitmqctl reset     #必须要重置

Resetting node rabbit@rabbit1 ...

[root@rabbit1 ~]# rabbitmqctl start_app

Starting node rabbit@rabbit1 ...

 completed with 0 plugins.

现在查看集群状态,三个节点都时作为独立的节点

请注意,rabbit@rabbit2保留了簇的剩余状态,而rabbit@rabbit1 和rabbit@rabbit3是刚刚初始化的RabbitMQ。如果我们想重新初始化rabbit@rabbit2,我们按照与其他节点相同的步骤进行:

1

2

3

4

5

6

7

8

9

[root@rabbit2 ~]# rabbitmqctl stop_app

Stopping rabbit application on node rabbit@rabbit2 ...

[root@rabbit2 ~]# rabbitmqctl reset

Resetting node rabbit@rabbit2 ...

[root@rabbit2 ~]# rabbitmqctl start_app

Starting node rabbit@rabbit2 ...

 completed with 0 plugins.

主机名更改

RabbitMQ节点使用主机名相互通信。因此,所有节点名称必须能够解析所有集群对等的名称。像rabbitmqctl这样的工具也是如此
除此之外,默认情况下RabbitMQ使用系统的当前主机名来命名数据库目录。如果主机名更改,则会创建一个新的空数据库。为了避免数据丢失,建立一个固定和可解析的主机名至关重要。每当主机名更改时,您应该重新启动RabbitMQ
如果要使用节点名称的完整主机名(RabbitMQ默认为短名称),并且可以使用DNS解析完整的主机名,则可能需要调查设置环境变量 RABBITMQ_USE_LONGNAME = true

从客户端连接到群集

客户端可以正常连接到群集中的任何节点。如果该节点出现故障,并且集群的其余部分仍然存在,那么客户端应该注意到已关闭的连接,并且应该能够重新连接到群集的一些幸存的成员。通常,将节点主机名或IP地址烧入客户端应用程序是不可取的:这会引入不灵活性,并且如果集群配置发生更改或集群中节点数发生更改,则需要编辑,重新编译和重新部署客户端应用程序。相反,我们推荐一个更抽象的方法:这可能是一个动态的DNS服务,它具有非常短的TTL配置,或者一个普通的TCP负载均衡器,或者用起搏器或类似技术实现的某种移动IP。一般来说

具有RAM节点的集群

RAM节点只将其元数据保存在内存中。由于RAM节点不必像光盘节点那样写入光盘,它们可以更好地执行。但是请注意,由于永久队列数据总是存储在磁盘上,因此性能改进将仅影响资源管理(例如添加/删除队列,交换或虚拟主机),但不会影响发布速度或消耗速度
RAM节点是高级用例; 设置你的第一个群集时,你应该不使用它们。您应该有足够的光盘节点来处理您的冗余要求,然后在需要时添加额外的RAM节点进行缩放
只包含RAM节点的集群是脆弱的; 如果群集停止,您将无法再次启动, 并将丢失所有数据。RabbitMQ将阻止在许多情况下创建RAM节点的群集,但是它不能完全阻止它

这里的例子仅仅为了简单起见,显示了具有一个光盘和一个RAM节点的集群; 这样的集群是一个糟糕的设计选择

创建RAM节点
我们可以在首次加入集群时将节点声明为RAM节点。像之前一样,我们使用rabbitmqctl join_cluster来完成此 操作,但传递 --ram标志

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

rabbit2$ rabbitmqctl stop_app

Stopping node rabbit@rabbit2 ...done

.

rabbit2$ rabbitmqctl join_cluster --ram rabbit@rabbit1

Clustering node rabbit@rabbit2 with [rabbit@rabbit1] ...done.

rabbit2$ rabbitmqctl start_app

Starting node rabbit@rabbit2 ...done.

RAM节点在集群状态中显示为:

rabbit1$ rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit1 ...

[{nodes,[{disc,[rabbit@rabbit1]},{ram,[rabbit@rabbit2]}]},

 {running_nodes,[rabbit@rabbit2,rabbit@rabbit1]}]

...done.

rabbit2$ rabbitmqctl cluster_status

Cluster status of node rabbit@rabbit2 ...

[{nodes,[{disc,[rabbit@rabbit1]},{ram,[rabbit@rabbit2]}]},

 {running_nodes,[rabbit@rabbit1,rabbit@rabbit2]}]

...done.

更改节点类型
我们可以将节点的类型从ram更改为disc,反之亦然。假设我们想要颠倒rabbit @ rabbit2和rabbit @ rabbit1的类型 ,将前者从ram节点转换为disc节点,将后者从disc节点转换为ram节点。要做到这一点,我们可以使用 change_cluster_node_type命令。该节点必须先停止

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

rabbit2$ rabbitmqctl stop_app

Stopping node rabbit@rabbit2 ...done.

rabbit2$ rabbitmqctl change_cluster_node_type disc

Turning rabbit@rabbit2 into a disc node ...

...done.

Starting node rabbit@rabbit2 ...done.

rabbit1$ rabbitmqctl stop_app

Stopping node rabbit@rabbit1 ...done.

rabbit1$ rabbitmqctl change_cluster_node_type ram

Turning rabbit@rabbit1 into a ram node ...

rabbit1$ rabbitmqctl start_app

Starting node rabbit@rabbit1 ...done.

  

每天进步一点,加油!

猜你喜欢

转载自my.oschina.net/longsailer/blog/1634756