多线程技术点-JDK并发包-线程池-分而治之:Fork/Join框架

分而治之

  一个非常有效地处理大量数据的方法。著名的MapReduce也是采取分而治之的思想。简单来说,就是如果你要处理1000个数据,但是你并不具备处理1000个数据的能力,那么你可以只处理其中的10个,然后分阶段处理100次,将100次的结果进行合并,那就是最终想要的对原始1000个数据的处理结果。

Fork/Join框架

  Java中通过使用fork()后系统多了一个执行分支(线程),索引需要等待这个执行分支执行完毕,才有可能得到最终结果,因此join就表示等待。

如果毫无顾忌地使用fork()开启线程进行处理,那么很有可能导致系统开启过多的线程而严重影响性能。所有JDK提供了一个ForkJoinPool线程池,对于fork()方法并不急着开启线程,而是提交给ForkJoinPool线程池处理,以节省系统资源。

ForkJoinPool线程池

  流程图

  

  注:由于线程池的优化,提交的任务和线程数量并不是一对一的关系。在绝大多数情况,一个物理线程实际上是需要处理多个逻辑任务的。因此,每个线程必然需要拥有一个任务队列。因此在实际执行过程中,可能遇到这种情况:线程A已经把自己的任务都执行完成了,而线程B还有一堆任务等着处理,此时,线程A就会"帮助"线程B,从线程B的任务队列中拿一个任务过来处理,尽可能地达到平衡。如下图,显示了这种互相帮助的精神。值得注意的是,当线程师徒帮助别人时,总是从任务队列底部开始拿数据,而线程试图执行自己的任务时,则是从相反的顶部开始拿,因此这种行为有利于避免数据竞争。

扫描二维码关注公众号,回复: 44241 查看本文章

猜你喜欢

转载自www.cnblogs.com/daishengda/p/8909524.html