2.1.3 hadoop体系之离线计算-hdfs分布式文件系统-Block块的副本放置策略

        我们的认知深度已经从数据模型到架构模型到决策模型。下面我们详细讲解一下其副本放置策略问题。白色的是我们的数据,黑色的是我们产生的三个副本,这三个副本应该怎么放置呢?有什么样的一个策略呢?

        机柜中除了放置服务器之外还会放置交换机,每个交换机专门为一台机柜配备,用于设备之间通信。每台机柜有条线,用于连接交换机,直接从交换机跳到服务器点对点的连接。除了配置交换机,机柜中还有一个电源模块,这个电源模块控制机柜的电源输出。电源模块、交换机与机柜中的服务器组成了一个最小的单元,其中一者换了,机柜也就废了,不能与外界通信。

        第一个副本:如果客户端和文件恰巧在集群中的一个节点上,第一个副本就放置在本节点上;如果是集群外提交,则随机挑选一台磁盘不太满、cpu不太忙的节点。第二个副本:放置在于第一个副本不同的机架的节点上。第三个副本:与第二个副本相同机架的不同节点(同机架不同服务器)。更多副本:随机节点。

猜你喜欢

转载自blog.csdn.net/Suyebiubiu/article/details/108446992