程序员人生 网站导航

Java NIO教程

栏目:综合技术时间:2015-07-03 08:31:18
Java NIO(New IO)是从Java 1.4版本开始引入的1个新的IO API,可以替换标准的Java IO API。本系列教程将有助于你学习和理解Java NIO。

Java NIO提供了与标准IO不同的IO工作方式:

  • Channels and Buffers(通道和缓冲区):标准的IO基于字节流和字符流进行操作的,而NIO是基于通道(Channel)和缓冲区(Buffer)进行操作,数据总是从通道读取到缓冲区中,或从缓冲区写入到通道中。
  • Asynchronous IO(异步IO):Java NIO可让你异步的使用IO,例如:当线程从通道读取数据到缓冲区时,线程还是可以进行其他事情。当数据被写入到缓冲区时,线程可以继续处理它。从缓冲区写入通道也类似。
  • Selectors(选择器):Java NIO引入了选择器的概念,选择器用于监听多个通道的事件(比如:连接打开,数据到达)。因此,单个的线程可以监听多个数据通道。
下面就来详细介绍Java NIO的相干知识。

目 录

      1.  Java NIO 概述
      2. Java NIO vs. IO
      3. 通道(Channel)
      4. 缓冲区(Buffer)
      5. 分散(Scatter)/聚集(Gather)
      6. 通道之间的数据传输
      7. 选择器(Selector)
      8. 文件通道
      9. Socket 通道
     10. ServerSocket 通道
     11. Datagram 通道
     12. 管道(Pipe)

Java NIO 概述 


Java NIO 由以下几个核心部份组成:

  • Channels
  • Buffers
  • Selectors
虽然Java NIO 中除此以外还有很多类和组件,但在我看来,Channel,Buffer 和 Selector 构成了核心的API。其它组件,如Pipe和FileLock,只不过是与3个核心组件共同使用的工具类。因此,在概述中我将集中在这3个组件上。其它组件会在单独的章节中讲到。

Channel 和 Buffer

基本上,所有的 IO 在NIO 中都从1个Channel 开始。Channel 有点象流。 数据可以从Channel读到Buffer中,也能够从Buffer 写到Channel中。这里有个图示:



Channel和Buffer有好几种类型。下面是JAVA NIO中的1些主要Channel的实现:

  • FileChannel
  • DatagramChannel
  • SocketChannel
  • ServerSocketChannel
正如你所看到的,这些通道涵盖了UDP 和 TCP 网络IO,和文件IO。

与这些类1起的有1些有趣的接口,但为简单起见,我尽可能在概述中不提到它们。本教程其它章节与它们相干的地方我会进行解释。

以下是Java NIO里关键的Buffer实现:

  • ByteBuffer
  • CharBuffer
  • DoubleBuffer
  • FloatBuffer
  • IntBuffer
  • LongBuffer
  • ShortBuffer
这些Buffer覆盖了你能通过IO发送的基本数据类型:byte, short, int, long, float, double 和 char。

Java NIO 还有个 Mappedyteuffer,用于表示内存映照文件, 我也不打算在概述中说明。

Selector

Selector允许单线程处理多个 Channel。如果你的利用打开了多个连接(通道),但每一个连接的流量都很低,使用Selector就会很方便。例如,在1个聊天服务器中。

这是在1个单线程中使用1个Selector处理3个Channel的图示:



要使用Selector,得向Selector注册Channel,然后调用它的select()方法。这个方法会1直阻塞到某个注册的通道有事件就绪。1旦这个方法返回,线程就能够处理这些事件,事件的例子有如新连接进来,数据接收等。


Java NIO vs. IO 




当学习了Java NIO和IO的API后,1个问题马上涌入脑海:

援用
我应当什么时候使用IO,什么时候使用NIO呢?在本文中,我会尽可能清晰地解析Java NIO和IO的差异、它们的使用处景,和它们如何影响您的代码设计。


Java NIO和IO的主要区分

下表总结了Java NIO和IO之间的主要差别,我会更详细地描写表中每部份的差异。

IO NIO
Stream oriented Buffer oriented
Blocking IO Non blocking IO
  Selectors


面向流与面向缓冲

Java NIO和IO之间第1个最大的区分是,IO是面向流的,NIO是面向缓冲区的。 Java IO面向流意味着每次从流中读1个或多个字节,直至读取所有字节,它们没有被缓存在任何地方。另外,它不能前后移动流中的数据。如果需要前后移动从流中读取的数据,需要先将它缓存到1个缓冲区。 Java NIO的缓冲导向方法略有不同。数据读取到1个它稍后处理的缓冲区,需要时可在缓冲区中前后移动。这就增加了处理进程中的灵活性。但是,还需要检查是不是该缓冲区中包括所有您需要处理的数据。而且,需确保当更多的数据读入缓冲区时,不要覆盖缓冲区里还没有处理的数据。

阻塞与非阻塞IO

Java IO的各种流是阻塞的。这意味着,当1个线程调用read() 或 write()时,该线程被阻塞,直到有1些数据被读取,或数据完全写入。该线程在此期间不能再干任何事情了。 Java NIO的非阻塞模式,使1个线程从某通道发送要求读取数据,但是它仅能得到目前可用的数据,如果目前没有数据可用时,就甚么都不会获得。而不是保持线程阻塞,所以直至数据变的可以读取之前,该线程可以继续做其他的事情。 非阻塞写也是如此。1个线程要求写入1些数据到某通道,但不需要等待它完全写入,这个线程同时可以去做别的事情。 线程通常将非阻塞IO的空闲时间用于在其它通道上履行IO操作,所以1个单独的线程现在可以管理多个输入和输出通道(channel)。

选择器(Selectors)

Java NIO的选择器允许1个单独的线程来监视多个输入通道,你可以注册多个通道使用1个选择器,然后使用1个单独的线程来“选择”通道:这些通道里已有可以处理的输入,或选择已准备写入的通道。这类选择机制,使得1个单独的线程很容易来管理多个通道。

NIO和IO如何影响利用程序的设计

不管您选择IO或NIO工具箱,可能会影响您利用程序设计的以下几个方面:

  • 对NIO或IO类的API调用。
  • 数据处理。
  • 用来处理数据的线程数。
API调用

固然,使用NIO的API调用时看起来与使用IO时有所不同,但这其实不意外,由于其实不是仅从1个InputStream逐字节读取,而是数据必须先读入缓冲区再处理。

数据处理

使用纯洁的NIO设计相较IO设计,数据处理也遭到影响。

在IO设计中,我们从InputStream或 Reader逐字节读取数据。假定你正在处理1基于行的文本数据流,例如:

代码
  1. Name: Anna  
  2. Age: 25  
  3. Email: anna@mailserver.com  
  4. Phone: 1234567890  


该文本行的流可以这样处理:

Java代码
  1. InputStream input = … ; // get the InputStream from the client socket  
  2. BufferedReader reader = new BufferedReader(new InputStreamReader(input));  
  3.   
  4. String nameLine   = reader.readLine();  
  5. String ageLine    = reader.readLine();  
  6. String emailLine  = reader.readLine();  
  7. String phoneLine  = reader.readLine();  


请注意处理状态由程序履行多久决定。换句话说,1旦reader.readLine()方法返回,你就知道肯定文本行就已读完, readline()阻塞直到整行读完,这就是缘由。你也知道此行包括名称;一样,第2个readline()调用返回的时候,你知道这行包括年龄等。 正如你可以看到,该处理程序仅在有新数据读入时运行,并知道每步的数据是甚么。1旦正在运行的线程已处理过读入的某些数据,该线程不会再回退数据(大多如此)。下图也说明了这条原则:


从1个阻塞的流中读数据


而1个NIO的实现会有所不同,下面是1个简单的例子:

Java代码
  1. ByteBuffer buffer = ByteBuffer.allocate(48);  
  2.   
  3. int bytesRead = inChannel.read(buffer);  


注意第2行,从通道读取字节到ByteBuffer。当这个方法调用返回时,你不知道你所需的所有数据是不是在缓冲区内。你所知道的是,该缓冲区包括1些字节,这使得处理有点困难。
假定第1次 read(buffer)调用后,读入缓冲区的数据只有半行,例如,“Name:An”,你能处理数据吗?明显不能,需要等待,直到整行数据读入缓存,在此之前,对数据的任何处理毫无意义。

所以,你怎样知道是不是该缓冲区包括足够的数据可以处理呢?好了,你不知道。发现的方法只能查看缓冲区中的数据。其结果是,在你知道所有数据都在缓冲区里之前,你必须检查几次缓冲区的数据。这不但效力低下,而且可使程序设计方案杂乱不堪。例如:

Java代码
  1. ByteBuffer buffer = ByteBuffer.allocate(48);  
  2. int bytesRead = inChannel.read(buffer);  
  3. while(! bufferFull(bytesRead) ) {  
  4. bytesRead = inChannel.read(buffer);  
  5. }  


bufferFull()方法必须跟踪有多少数据读入缓冲区,并返回真或假,这取决于缓冲区是不是已满。换句话说,如果缓冲区准备好被处理,那末表示缓冲区满了。

bufferFull()方法扫描缓冲区,但必须保持在bufferFull()方法被调用之前状态相同。如果没有,下1个读入缓冲区的数据可能没法读到正确的位置。这是不可能的,但却是需要注意的又1问题。

如果缓冲区已满,它可以被处理。如果它不满,并且在你的实际案例中成心义,你也许能处理其中的部份数据。但是许多情况下并不是如此。下图展现了“缓冲区数据循环就绪”:


从1个通道里读数据,直到所有的数据都读到缓冲区里


总结

NIO可以让您只使用1个(或几个)单线程管理多个通道(网络连接或文件),但付出的代价是解析数据可能会比从1个阻塞流中读取数据更复杂。

如果需要管理同时打开的不计其数个连接,这些连接每次只是发送少许的数据,例如聊天服务器,实现NIO的服务器多是1个优势。一样,如果你需要保持许多打开的连接到其他计算机上,如P2P网络中,使用1个单独的线程来管理你所有出站连接,多是1个优势。1个线程多个连接的设计方案以下图所示:


单线程管理多个连接


如果你有少许的连接使用非常高的带宽,1次发送大量的数据,或许典型的IO服务器实现可能非常契合。下图说明了1个典型的IO服务器设计:


1个典型的IO服务器设计:1个连接通过1个线程处理


通道(Channel) 




Java NIO的通道类似流,但又有些不同:

  • 既可以从通道中读取数据,又可以写数据到通道。但流的读写通常是单向的。
  • 通道可以异步地读写。
  • 通道中的数据总是要先读到1个Buffer,或总是要从1个Buffer中写入。
正如上面所说,从通道读取数据到缓冲区,从缓冲区写入数据到通道。以下图所示:



Channel的实现

这些是Java NIO中最重要的通道的实现:

  • FileChannel:从文件中读写数据。
  • DatagramChannel:能通过UDP读写网络中的数据。
  • SocketChannel:能通过TCP读写网络中的数据。
  • ServerSocketChannel:可以监听新进来的TCP连接,像Web服务器那样。对每个新进来的连接都会创建1个SocketChannel。
基本的 Channel 示例

下面是1个使用FileChannel读取数据到Buffer中的示例:

Java代码
  1. RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt""rw");  
  2. FileChannel inChannel = aFile.getChannel();  
  3.   
  4. ByteBuffer buf = ByteBuffer.allocate(48);  
  5.   
  6. int bytesRead = inChannel.read(buf);  
  7. while (bytesRead != -1) {  
  8.   
  9. System.out.println("Read " + bytesRead);  
  10. buf.flip();  
  11.   
  12. while(buf.hasRemaining()){  
  13. System.out.print((char) buf.get());  
  14. }  
  15.   
  16. buf.clear();  
  17. bytesRead = inChannel.read(buf);  
  18. }  
  19. aFile.close();  


注意 buf.flip() 的调用,首先读取数据到Buffer,然后反转Buffer,接着再从Buffer中读取数据。下1节会深入讲授Buffer的更多细节。



缓冲区(Buffer) 




Java NIO中的Buffer用于和NIO通道进行交互。如你所知,数据是从通道读入缓冲区,从缓冲区写入到通道中的。

缓冲区本质上是1块可以写入数据,然后可以从中读取数据的内存。这块内存被包装成NIO Buffer对象,并提供了1组方法,用来方便的访问该块内存。

Buffer的基本用法

使用Buffer读写数据1般遵守以下4个步骤:

  • 写入数据到Buffer
  • 调用flip()方法
  • 从Buffer中读取数据
  • 调用clear()方法或compact()方法

当向buffer写入数据时,buffer会记录下写了多少数据。1旦要读取数据,需要通过flip()方法将Buffer从写模式切换到读模式。在读模式下,可以读取之前写入到buffer的所有数据。

1旦读完了所有的数据,就需要清空缓冲区,让它可以再次被写入。有两种方式能清空缓冲区:调用clear()或compact()方法。clear()方法会清空全部缓冲区。compact()方法只会清除已读过的数据。任何未读的数据都被移到缓冲区的起始处,新写入的数据将放到缓冲区未读数据的后面。

下面是1个使用Buffer的例子:

Java代码
  1. RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt""rw");  
  2. FileChannel inChannel = aFile.getChannel();  
  3.   
  4. //create buffer with capacity of 48 bytes  
  5. ByteBuffer buf = ByteBuffer.allocate(48);  
  6.   
  7. int bytesRead = inChannel.read(buf); //read into buffer.  
  8. while (bytesRead != -1) {  
  9.   
  10.   buf.flip();  //make buffer ready for read  
  11.   
  12.   while(buf.hasRemaining()){  
  13.       System.out.print((char) buf.get()); // read 1 byte at a time  
  14.   }  
  15.   
  16.   buf.clear(); //make buffer ready for writing  
  17.   bytesRead = inChannel.read(buf);  
  18. }  
  19. aFile.close();  


Buffer的capacity,position和limit

缓冲区本质上是1块可以写入数据,然后可以从中读取数据的内存。这块内存被包装成NIO Buffer对象,并提供了1组方法,用来方便的访问该块内存。

为了理解Buffer的工作原理,需要熟习它的3个属性:

  • capacity
  • position
  • limit

position和limit的含义取决于Buffer处在读模式还是写模式。不管Buffer处在甚么模式,capacity的含义总是1样的。

这里有1个关于capacity,position和limit在读写模式中的说明,详细的解释在插图后面。



capacity

作为1个内存块,Buffer有1个固定的大小值,也叫“capacity”.你只能往里写capacity个byte、long,char等类型。1旦Buffer满了,需要将其清空(通过读数据或清除数据)才能继续写数据往里写数据。

position

当你写数据到Buffer中时,position表示当前的位置。初始的position值为0.当1个byte、long等数据写到Buffer后, position会向前移动到下1个可插入数据的Buffer单元。position最大可为capacity
------分隔线----------------------------
------分隔线----------------------------

最新技术推荐