netty5笔记-线程模型2-EventLoopGroup

阅读本文之前，你需要对java的线程池有一定的了解，因为这里不会过多的讲解。

今天我们主要的任务就是看下netty中一个非常重要的类EventLoop，通过这系列文章，你应该了解EventLoop适用的场景，不会滥用它而导致你的应用缓慢。Netty使用了典型的Reactor模型结构，这其中一个很重要的角色就是EventLoop，它使用循环的方式来处理IO或者其他事件。

上图是EventLoop的接口继承关系，其中Executor、ExecutorService、ScheduledExecutorService是java提供的线程池管理接口：

ScheduledExecutorService：提供执行计划任务的接口；

EventExecutorGroup：提供管理EventExecutor的能力，他通过next()来为任务分配执行线程，同时也提供了shutdownGracefully这一优雅下线的接口；

方法	说明
shutdownGraceFully	优雅关闭（何为优化关闭后面会介绍）
isShuttingDown	其管理的所有EventExecutor是否关闭
terminationFuture	返回接收该线程池彻底关闭事件的Future
children	含所有管理的EventExecutor
next	通过该方法来为任务分配一个EventExecutor

EventExecutor：实际的事件执行者

方法	说明
parent	管理它的EventExecutorGroup
isEventLoop	当前线程与EventExecutor的执行线程是否是同一个线程，如果是则此处返回true
newPromise	创建一个Promise，由该EventExecutor来执行Promise中的listener

EventLoopGroup: EventLoopGroup和EventLoop的关系与EventExecutorGroup和EventExecutor的关系类似

方法	说明
register	将channel注册到该EventLoopGroup，注册后EventLoop会负责该channel的相关io事件

EventLoop：处理所有的IO操作。EventLoop继承了EventLoopGroup接口，可以被当做一个single的线程池看到（虽然模式差不多，但其实和java的single线程池区别很大）。

我们找一个最常用的EventLoop实现类来介绍：NioEventLoop。介绍它之前我们得先介绍NioEventLoopGroup，一个连接被它分配到对应的NioEventLoop并进行一系列的后续操作。先看看NioEventLoopGroup的构造函数，最终调用的是下面这个构造方法：

[java]view plain copy
       private MultithreadEventExecutorGroup(int nEventExecutors,  
                                          Executor executor,  
                                          boolean shutdownExecutor,  
                                          Object... args) {  
       if (nEventExecutors <= 0) {  
            throw new IllegalArgumentException(  
                    String.format("nEventExecutors: %d (expected: > 0)", nEventExecutors));  
        }  
  
        if (executor == null) {  
            executor = newDefaultExecutorService(nEventExecutors);  
            shutdownExecutor = true;  
        }  
  
        // 根据nEventExecutors确定EventExecutor的数量  
        children = new EventExecutor[nEventExecutors];  
        // 用了两种不同的方式来为一个任务分配EventExecutor,。  
        // 两种实现结果是相同的，但是第一种利用的位运算，相对效率更高点。。。  
        // 具体的实现是从children的第一个开始获取，从0->size-1依次取child，到达最后一个后回到第一个child，最终形成一个环形数组。  
        if (isPowerOfTwo(children.length)) {  
            chooser = new PowerOfTwoEventExecutorChooser();  
        } else {  
            chooser = new GenericEventExecutorChooser();  
        }  
  
        // 开始初始化每个EventExecutor  
        for (int i = 0; i < nEventExecutors; i ++) {  
            boolean success = false;  
            try {  
                // 实际的初始化由子类自己实现，如NioEventLoopGroup的实现为：  
                // return new NioEventLoop(this, executor, (SelectorProvider) args[0]);  
                children[i] = newChild(executor, args);  
                success = true;  
            } catch (Exception e) {  
                // TODO: Think about if this is a good exception type  
                throw new IllegalStateException("failed to create a child event loop", e);  
            } finally {  
                // 如果初始化的过程中发生异常，则将初始化好的EventExecutor全部关闭  
                if (!success) {  
                    for (int j = 0; j < i; j ++) {  
                        children[j].shutdownGracefully();  
                    }  
  
                    for (int j = 0; j < i; j ++) {  
                        EventExecutor e = children[j];  
                        // 等待关闭完成  
                        try {  
                            while (!e.isTerminated()) {  
                                e.awaitTermination(Integer.MAX_VALUE, TimeUnit.SECONDS);  
                            }  
                        } catch (InterruptedException interrupted) {  
                            // Let the caller handle the interruption.  
                            Thread.currentThread().interrupt();  
                            break;  
                        }  
                    }  
                }  
            }  
        }  
  
        final boolean shutdownExecutor0 = shutdownExecutor;  
        final Executor executor0 = executor;  
        final FutureListener<Object> terminationListener = new FutureListener<Object>() {  
            @Override  
            public void operationComplete(Future<Object> future) throws Exception {  
                // 最后一个关闭完成则标记future完成  
                if (terminatedChildren.incrementAndGet() == children.length) {  
                    terminationFuture.setSuccess(null);  
                    if (shutdownExecutor0) {  
                        // This cast is correct because shutdownExecutor0 is only try if  
                        // executor0 is of type ExecutorService.  
                        ((ExecutorService) executor0).shutdown();  
                    }  
                }  
            }  
        };  
  
        // 下面的代码比较简单，不过多介绍  
        xxxxxxxxxxxxxxxxxxxxxxxx  
    }  
  
    // 看看这两个实现类的差异，这效率扣得不要不要的啊！  
    private final class PowerOfTwoEventExecutorChooser implements EventExecutorChooser {  
        @Override  
        public EventExecutor next() {  
            return children[childIndex.getAndIncrement() & children.length - 1];  
        }  
    }  
  
    private final class GenericEventExecutorChooser implements EventExecutorChooser {  
        @Override  
        public EventExecutor next() {  
            return children[Math.abs(childIndex.getAndIncrement() % children.length)];  
        }  
    }  

我们在使用NioEventGroupLoop的时候，一般都是直接使用默认构造方法，此时第一个参数nEventExecutors=cpu核数 x 2。NioEventGroupLoop中有很大部分的io操作，这个默认值比较靠谱，不用用户再去修改。

[java]view plain copy
private static final int DEFAULT_EVENT_LOOP_THREADS;  
  
static {  
    DEFAULT_EVENT_LOOP_THREADS = Math.max(1, SystemPropertyUtil.getInt(  
            "io.netty.eventLoopThreads", Runtime.getRuntime().availableProcessors() * 2));  
  
    if (logger.isDebugEnabled()) {  
        logger.debug("-Dio.netty.eventLoopThreads: {}", DEFAULT_EVENT_LOOP_THREADS);  
    }  
}  

构造方法的第二个参数executor，它是执行EventExecutor中的任务的实际线程池。默认使用的是netty实现的ForkJoinPool（比较复杂，有空再回过头来分析）。可以看出NioEventLoop本身是不负责线程的创建销毁的，他把执行逻辑封装在Runnable中交给executor处理，这里的模型和netty4已经不太一样，4的EventLoop对应一个固定线程，而5的EventLoop并未固定到一个线程。这也是我困惑的地方，executor的线程数与EventLoop个数相同，能保证每个EventLoop都有线程去执行，但是每个EventLoop不再是固定的Thread了，它带来的问题是一些ThreadLocal的cache可能会失效。不知道为何会这样设计，先在这留个疑问吧，等release版本出来了再看看。

构造方法的最后一个参数args[0]=SelectorProvider.provider(); SelectorProvider根据不同的操作系统创建出对应的provider，如linux下创建的是sun.nio.ch.EPollSelectorProvider。该参数在NioEventLoop初始化的时候被传入，用于创建Selector（这里有一篇Selector的介绍）。

往EventLoopGroup中提交一个任务，实际上就是交给其child(即EventLoop)处理：

[java]view plain copy
    public <T> Future<T> submit(Callable<T> task) {  
        return next().submit(task);  
    }  
    public EventExecutor next() {  
        return chooser.next();  
    }  
  
        // next方法的其中一个实现，这样可以保证每个child中处理的连接数基本相同  
        public EventExecutor next() {  
            return children[childIndex.getAndIncrement() & children.length - 1];  
        }  

Event LoopGroup提供了一个注册Channel(表示一个连接）的接口：

[java]view plain copy
public ChannelFuture register(Channel channel) {  
    return next().register(channel);  
}  

就一句代码，背后隐藏的信息却非常重要：连接在注册时就绑定了一个固定的EventLoop，绑定的方式为将channel注册到EventLoop所在的Selector，此连接的读写及其他相关操作（如编码解码、超时管理）都交给了这个EventLoop；因此正常情况下一个连接涉及到的方法（如读/写/编解码/超时管理）都在一个EventLoop中进行，意味着所有这些操作都是线程安全的。还记得netty3吗，超时管理是交给HashedWheelTimer进行管理的，由于超时任务和读写任务是在不同的线程执行，如果超时的同时读入或写出数据也到达，可能会产生非预期的效果。然而由于线程模型的修改，虽然能保证线程安全，但却不再保证这些操作都在一个线程里，这种情况下ThreadLocal的相关功能可能会失效。

这里又引申出一个问题，由于一个连接是和一个EventLoop绑定的，如果EventLoop中存在一个执行时间很长的任务，那该EventLoop后续的所有连接都会被hold住得不到处理，因此应用不要在handler中添加会阻塞或者执行时间很长的操作。网上看到很多文章说是把业务操作放到io线程里去执行，导致系统处理慢甚至挂掉，希望看了这篇文章的同学不要犯同样的错。

[java]view plain copy
/** 
  * 设置I/O操作在EventLoop中占的时间比，(0-100)，默认为50，即执行I/O的时间与非I/O的时间相同 
  */  
 public void setIoRatio(int ioRatio) {  
     for (EventExecutor e: children()) {  
         ((NioEventLoop) e).setIoRatio(ioRatio);  
     }  
 }  
  
 /** 
  * 当epoll占用100%时（早期jdk的bug，不知道现在彻底处理了没），使用此方法来用新的Selector替代老的EventLoop中的Selector 
  */  
 public void rebuildSelectors() {  
     for (EventExecutor e: children()) {  
         ((NioEventLoop) e).rebuildSelector();  
     }  
 }  

好了，到这里NioEventLoopGroup的基本功能就这么多，实现不复杂，但初始化使用的几个默认值需要关注。看了这里你是不是大概明白了上一篇文章中那幅图的意思了。不过我还是准备强调下这几点（重要的事情多说一遍）：

1、NioEventLoopGroup下默认的NioEventLoop个数为cpu核数 * 2，因为有很多的io处理；

2、NioEventLoop和java的single线程池在5里差异变大了，它本身不负责线程的创建销毁，而是由外部传入的线程池管理。后面的文章会介绍，他的处理逻辑都封装到Runnable中了;

3、channel和EventLoop是绑定的，即一旦连接被分配到EventLoop，其相关的I/O、编解码、超时处理都在同一个EventLoop中，这样可以确保这些操作都是线程安全的，而不像netty3中可能会出现非预期的执行结果。但和netty4不同的是netty5中并不能保证一个连接的所有操作在同一个线程中，因此和ThreadLocal相关的功能可能会失效（比如内存池的PoolThreadCache在这种情况下无法达到最佳效果)。

补充：

关于executor的引入的一个讨论：https://github.com/netty/netty/issues/2250，从这个问题中，我们可以大概了解为什么netty5要这么改：

1、希望能留给用户更多空间来定制化I/O的执行

2、希望用到fork/jion框架的stealing机制，避免因个别连接问题导致整个任务链阻塞。目前还在思考如何修改netty的架构来达到这个目的。

3、目前的默认实现能够保证效率和之前的一样，能保证线程安全，但内存池之类的效率受到了挑战，这个也是这次改动需要考虑的。

如果最终这个改动成功，那么netty可能的变化：

1、整个线程模型改变；

2、用户可以自定义线程池的实现；

3、内存池的相应修改；

4、一个连接的阻塞不会影响其他连接（如果大量连接阻塞就没办法了）；

5、有可能可以直接在netty的线程池中执行长任务（执行时间长），而不用对业务处理单独开连接池。

6、一个连接的操作会保证线程安全，但不一定是在同一个线程中执行，因此如果有在I/O handler中使用ThreadLocal的同学，可以提前想下应对方案。

...等等...

想想有点小激动，不过挑战挺多的，是一次很大的底层改动。仰望大神！(遗憾的是5.0已经被干掉了！！！见 https://github.com/netty/netty/issues/4466)

netty5笔记-线程模型2-EventLoopGroup

猜你喜欢