Apache Geode 集群配置文件和故障排除

      当你在Geode中使用了集群配置服务,你可以在定位器的cluster_config目录中检查所创建的配置文件。gfsh会在集群级别和独立的组级别来保存配置文件。

       如下的目录和配置文件在运行集群配置服务的定位器上是可用的:

集群级别配置
      为了让配置文件在集群的所有成员中生效,定位器在cluster_config目录内部创建一个集群子目录(或在集群配置目录,当启动定位器时使用--cluster-config-dir=value参数)指定所有服务器当它们用gfsh命令启动时接收这个配置。这个目录包括:

    

  • cluster.xml – 一个Geode cache.xml 文件包括了适用于所有成员的配置 。
  • cluster.properties – 一个 Geode gemfire.properties 文件包括了适用于所有成员的属性。
  • 用于部署到所有成员的Jar文件 

组级别配置

    当你在gfsh命令中指定了--group参数,(例如,启动服务器或是创建区域)定位器为每个组的子目录以组名相同的名字写入配置。

当你启动一个服务器时指定一个或多个组名,服务器会收到集群级别的配置也会收到所有指定组的配置。这个子目录包括:

  • <group-name>.xml – 一个 cache.xml 文件包括了适用于组中所有成员的配置。
  • <group-name>.properties – 一个 Geode gemfire.properties文件包括了适用于组中所有成员的属性
  • 用于部署到组中所有成员的Jar文件

你可以导出包括了一个集群配置的所有组件的zip文件。这个zip文件包括了定位器的cluster_config(或是其它指定的)子目录中的所有文件。你可以导入这个配置到一个新的集群。查看《导入一导出集群配置》。

独立的配置文件和集群配置文件

      Geode首先应用集群范围的配置文件然后再应用组级别的配置。如果一个成员用自己定义的配置文件(cache.xml 文件和 gemfire.properties 文件),这些配置将被最后应用。在任何可能的时候,独立的成员中使用集群配置服务中的组级别配置文件替换非集群配置。

故障排除技巧

当你使用gfsh启动定位器, 你应该看到如下消息:

Cluster configuration service is up and running.

如果你没有看到这个消息,有可能你的集群配置服务存在问题。使用status cluster-configuration-service命令来检查集群配置状态。

  • 如果命令返回RUNNING,则集群配置在正常运行。
  • 如果命令返回WAITING,则运行 status locator命令。命令的输出返回WAITING状态的原因。

如果服务器启动时有如下异常:

ClusterConfigurationNotAvailableException, 集群配置服务可能不在RUNNING状态。因为从定位器请求集群配置的服务器不可用,启动服务器的命令失败了。

  • 你可以通过检查服务器的日志文件来检查服务器从定位器收到的是什么配置。查看《日志》

  •  如果一个启动服务器命令指定了一个 cache.xm文件它与集群配置想冲突,服务器可能启动失败。

  • 如果一个gfsh命令失败因为集群配置不能被保存,会显示如下消息:

Failed to persist the configuration changes due to this command, 
Revert the command to maintain consistency. Please use "status cluster-config-service" 
to determine whether Cluster configuration service is RUNNING."

这里有些类型的配置不能使用gfsh。查看《gfsh的限制》

猜你喜欢

转载自bewithme.iteye.com/blog/2324906