31. Java IO与NIO。
本文主要来自 http://tutorials.jenkov.com/java-nio/nio-vs-io.html
原文是英文版,可以去学习下原文的系列文章,下文主要我在原文的基础上做了翻译和个人理解。
在学习Java NIO和IO的API时候,我们很快就会想到这样一个问题:
什么时候应该使用IO,什么时候应该使用NIO?
在本文中,我将尝试阐明Java NIO和IO之间的区别,它们的用例以及它们如何影响代码的设计。
主要差异Betwen Java NIO和IO
下表总结了Java NIO和IO之间的主要区别。我将详细了解表格后面各节的不同之处。
IO | NIO |
面向流 | 面向缓冲 |
阻塞IO | 非阻塞IO |
无选择器 | 选择器 |
面向流与面向缓冲
Java NIO和IO之间的第一大区别是IO是面向流的,而NIO是面向缓冲区的。这是什么意思?
Java IO面向流意味着一次从流中读取一个或多个字节。读取字节的操作取决于你自己。它们没有被缓存到任何地方。而且,你不能前后移动数据流中的数据。如果你需要前后移动从流中读取的数据,则需要先将其缓存到缓冲区中。
Java NIO的面向缓冲区的方法略有不同。数据被读入缓冲区,稍后进行处理。你可以根据需要前后移动缓冲区。这在处理过程中给你更多的灵活性。但是,你还需要检查缓冲区是否包含你需要的所有数据,以便对其进行全面处理。而且,你需要确保在将更多数据读入缓冲区时,不会覆盖尚未处理的缓冲区中的数据。
阻塞与非阻塞IO
Java IO的各种流都是阻塞的。这意味着,当一个线程调用一个read()
或write()
,该线程被阻塞,直到有一些数据被读取,或者数据被完全写入。在此期间,该线程无法做其他任何事情。
Java NIO的非阻塞模式使线程能够能够从一个通道里请求读取数据,并且只获取当前可用的数据,或者当没有可用数据时,就什么也不读取。在数据可用且被读取之前,线程是可以继续做其他事情,而不是想IO那种保持阻塞状态。
非阻塞写也是一样的。一个线程请求写入一些数据到某个通道,但不需要等待它直到完成,这期间线程是可以继续做其他事情的。
线程通常将非阻塞IO的空闲时间用于在其它通道上执行IO操作,所以一个单独的线程现在可以管理多个输入和输出通道(channel)。
选择器
Java NIO的选择器允许单个线程监视多个输入通道。您可以注册多个通道只使用一个选择器,然后使用单个线程“选择”具有可用于处理的输入的通道,或选择准备写入的通道。这种选择器机制可以让单个线程很轻松的去管理多个通道。
NIO和IO如何影响应用程序设计
无论您选择NIO还是IO作为IO工具包,都可能会影响应用程序设计的以下方面:
- 对NIO或IO类的API调用。
- 数据的处理。
- 用于处理数据的线程数。
API调用
当然,使用NIO时的API调用与使用IO时的调用不同。这并不奇怪。因为并不是仅从一个InputStream逐字节读取,而是数据必须先读入缓冲区再处理。
数据处理
使用纯粹的NIO设计相较IO设计,数据处理也受到影响。
在IO设计中,我们从InputStream或 Reader逐字节读取数据。假设你正在处理一基于行的文本数据流,例如:
Name: Anna Age: 25 Email: [email protected] Phone: 1234567890
这条文本行的流处理可以像这样:
InputStream input = ... ; // get the InputStream from the client socket BufferedReader reader = new BufferedReader(new InputStreamReader(input)); String nameLine = reader.readLine(); String ageLine = reader.readLine(); String emailLine = reader.readLine(); String phoneLine = reader.readLine();
请注意处理状态由程序执行多久决定。换句话说,一旦reader.readLine()方法返回,你就知道肯定文本行就已读完, readLine()阻塞直到整行读完,这就是原因。你也知道此行包含名称;同样,第二个readLine()
调用返回的时候,你知道这行包含年龄等。
正如你可以看到,该处理程序仅在有新数据读入时运行,并知道每步的数据是什么。一旦正在运行的线程已处理过读入的某些数据,该线程不会再回退数据(大多如此)。下图也说明了这条原则: (Java IO: 从一个阻塞的流中读数据)
Java IO:从阻塞流中读取数据。 |
而一个NIO的实现会有所不同,下面是一个简单的例子:
ByteBuffer buffer = ByteBuffer.allocate(48); int bytesRead = inChannel.read(buffer);
注意第二行,从通道读取字节到ByteBuffer。当这个方法调用返回时,你不知道你所需的所有数据是否在缓冲区内。你所知道的是,该缓冲区包含一些字节,这使得处理有点困难。
假设第一次 read(buffer)调用后,读入缓冲区的数据只有半行,例如,“Name:An”,你能处理数据吗?显然不能,需要等待,直到整行数据读入缓存,在此之前,对数据的任何处理毫无意义。
所以,你怎么知道是否该缓冲区包含足够的数据可以处理呢?好了,你不知道。发现的方法只能查看缓冲区中的数据。其结果是,在你知道所有数据都在缓冲区里之前,你必须检查几次缓冲区的数据。这不仅效率低下,而且可以使程序设计方案杂乱不堪。例如:
ByteBuffer buffer = ByteBuffer.allocate(48); int bytesRead = inChannel.read(buffer); while(!bufferFull(bytesRead)){ bytesRead = inChannel.read(buffer); }
该bufferFull()
方法必须跟踪有多少数据呗读入缓冲区,并返回true
或者false
,这取决于缓冲区是否已满。换句话说,如果缓冲区准备好被处理,那么表示该缓冲区满了。
该bufferFull()
方法扫描缓冲区,但必须保持该缓冲区处于与该bufferFull()
方法被调用之前状态相同。否则,下一个读入缓冲区的数据可能无法读到正确的位置。这是不可能的,但却也是需要注意的又一问题。
如果缓冲区已满,它可以被处理。如果它没有满,并且在你的实际案例中有意义,你或许能处理其中的部分数据。但是许多情况下并非如此。下图展示了“缓冲区数据循环就绪”:
图中显示了is-data-in-buffer-ready循环:
Java NIO:从通道读取数据,直到所有需要的数据都在缓冲区中。 |
总结
NIO允许你只使用一个(或几个)单线程去管理多个通道(网络连接或文件),但付出的代价是解析数据可能会比从一个阻塞流中读取数据更为复杂。
如果需要管理同时打开的成千上万个连接,这些连接每次只是发送少量的数据,例如聊天服务器,实现NIO的服务器可能是一个优势。同样,如果你需要维持许多打开的连接到其他计算机上,如P2P网络中,使用一个单独的线程来管理你所有出站连接,可能是一个优势。一个线程多个连接的设计方案如下图所示:
Java NIO:管理多个连接的单个线程。 |
如果你有少量的连接使用非常高的带宽,则一次发送大量的数据,也许典型的IO服务器实现可能非常合适。下图说明了一个典型的IO服务器设计:
Java IO:经典的IO服务器设计 - 一个线程处理一个连接。 |
相关文章
打赏
如果觉得我的文章对你有帮助,有钱就捧个钱场,没钱就捧个人场,欢迎点赞或转发 ,并请注明原出处,谢谢....