前言

最近几天，Hadoop官方社区发布了2.9.0版本，这也是第一个2.9开头的小版本。相比较于之前的2.8版本，2.9版本中新增了不少新功能特性。其中关于HDFS模块的一个重要功能是HDFS Router Federation（基于路由的Federation）。有人可能好奇，这个功能与目前HDFS支持的federation功能有什么区别呢？一句话简单的来讲，就是之前federation是通过多namespace的方式，然后通过viewFs的方式在客户端维护一份挂载表，然后在逻辑上是同一个集群地址。这里笔者特意点出了客户端这3个字，因为是在客户端做路由分析，所以对于用户来说很不方便使用和维护，一旦未来映射关系需要做更改的时候。相比于老federation+ViewFS的方式，Router Federation则是在HDFS内部增加了软件层来帮我们做请求路由。本文笔者就来简单聊聊这个软件层的路由是怎么实现的。

Router Federation软件层结构

想较于ViewFs通过在客户端维护挂载表信息，Router Federation是真正做到了对客户端的完全透明。因为这部分映射信息将会被额外的保存下来，还会持久化出去。这个模块我们姑且称之为状态维护（State Maintenance）的模块。另外还有一个重要的部分是请求转发模块，这里我们称之为Request forward。

以上2个模块构成了HDFS新的Federation软件层的设计。在这层软件结构以下，就是各个子集群。每个子集群会与Federation软件层，进行信息交互。结构图如下：

Router Federation角色介绍

针对Router Federation软件层的各个模块，都对应的一个新的服务角色。比如，请求转发模块对应的角色名称就叫Router服务，后面部分描述简写为R。而映射关系存储模块叫做State Store服务。

我们首先来看Router服务，路由器角色，同时与底下的NameNode和上面的State Store服务通信。Router在这里主要有2个作用：

第一，提供Federation接口，这个接口是给客户端使用的，它会将客户端请求转发到正确的子集群上。
第二，收集NameNode的心跳信息，报告给State Store。这样State Store维护的信息是实时更新的。

Router路由服务并不只是一对一的，它可以是一个Router对应多个NameNode。这样的话，一个NameNode可能会同时被多个Router汇报，这个时候采用的算法是quorum协议。通过这样的设计，来实现Router服务的高可用性。一个Router挂了，不会影响系统的运行，每个Router都是独立运行的。Router汇报结构如下图：

接下来，我们来看另外一个关键的服务State Store服务。因为有了这个状态服务，所以Router路由服务它是无状态的。那么State Store存储的信息主要有哪些呢？答案如下：

1.各个NameNode的基础信息，包括地址信息，空间大小信息等基础信息。
2.远程挂载表信息，形式为路径–>真实路径信息，这个与之前viewFs基本类似。
各个Router的状态信息。
Federation情况下的balancer状态信息。

在上面4点中，笔者主要来聊聊第2点设计的一些细节。维护在State Store内部的远程挂载表信息，它可能会是很庞大的，因为目标映射的路径可能会很多。如下所示：

hdfs://tmp → hdfs://C0-1/tmp /* Folder tmp is mapped to folder tmp in subcluster C0-1 */
hdfs://share → hdfs://C0-2/share
hdfs://user/user1 → hdfs://C0-3/user/user1
hdfs://user/user2 → hdfs://C0-2/user2

所以设计者在这里提供了2类持久化的方案，一种是基于文件的保存，还有一种是保存在额外zookeeper服务上。

在ViewFS中，这些映射关系是用户主动配置在客户端的配置文件中的。而这在Router Federation中是不需要的，State Store服务内部有各个NameNode的信息，它能查询找到正确的NN，然后将映射信息保存下来。当然这些映射信息会被更新一旦被发现是过期或是不正确的时候。

Router Federation路由请求过程

结合上面的角色服务介绍，下面我们来看看一个客户端请求的完整过程，这样我们能直观地理解本文以上所阐述的内容了。

大致过程调用如下图所示，先后顺序已由数字标好（笑脸代表客户端用户）。

步骤1：客户端调用Router提供的请求接口。
步骤2：该Router向State Store服务查询该请求对应的正确的NN地址。
步骤3：Router得到正确的NN地址后，将请求转发到正确的NN上。
步骤4，然后NN返回文件数据所在的DN地址，客户端与此DN进行消息通信（读/写block文件数据）

以上就是今天笔者所要阐述的内容，为了式文章更加精简易懂一些，笔者省略了其中很多的细节，感兴趣的读者朋友可以阅读社区文档或原始设计文档。链接如下：

[1].http://hadoop.apache.org/docs/r2.9.0/hadoop-project-dist/hadoop-hdfs/HDFSRouterFederation.html
[2].https://issues.apache.org/jira/secure/attachment/12806670/HDFS%20Router%20Federation.pdf

HDFS基于路由的Federation方案

前言

Router Federation软件层结构

Router Federation角色介绍

Router Federation路由请求过程

猜你喜欢