IO/InputStreamReader、OutputStreamWriter编码问题分析

一、理论:

1、字符流和字节流区别是什么?

字符流=字节流+编码集,在实际读取的时候其实字符流还是按照字节来读取,但是会更具编码集进行查找编码集字典解析相应的字节,使得一次读取出一个字符;

2、什么是转换流?

转换流就是原本是字节流,但是读取到的数据是字符,所以我们希望使用字符流来进行操作,那么就可以使用转换流进行转换;

转换流=字节流+编码集。

转换流的特点是可以指定编码集。

3、转换流的作用:

(1)、从控制台读取数据输入(键盘输入),将它们写入到文件(我们写的是字符吧);

(2)、当对文件进行解析的时候,如果涉及编码,就需要使用转换流进行解码--------乱码可不好玩。

二、实战:

1、从键盘输入的文本保存到文件:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
try  (InputStreamReader inReader =  new  InputStreamReader(System.in)) {
     StringBuilder sb =  new  StringBuilder();
 
     int  ch;
     try  (OutputStream out =  new  FileOutputStream( "console.txt" )) {
         while  ((ch = inReader.read()) != - 1 ) {
             if  (( char ) ch ==  '\r' )
                 continue ;
 
             if  (( char ) ch ==  '\n' ) {
                 System.out.println(sb.toString().toUpperCase());
                 out.write(sb.toString().getBytes());
                 sb.delete( 0 , sb.length());
                 continue ;
             }
 
             sb.append(( char ) ch);
             if  (sb.toString().equals( "esc" ))
                 break ;
         }
     }
 
}

  1)、我们经常使用的System.out.println就是输入流,自然,和它相对应的就是输入流,输入者是键盘,输出的对象是到控制台;

 

2、编码和解码:

1
2
3
4
5
6
7
8
9
10
11
try  (BufferedReader inReaderGBK =  new  BufferedReader( new  InputStreamReader( new  FileInputStream( "gbk.txt" ),  "gbk" ))) {
 
     try  (BufferedWriter outWriterUTF8 =  new  BufferedWriter( new  OutputStreamWriter( new  FileOutputStream( "人类简史.txt" ),  "utf-8" ))) {
 
         int  ch;
         while  ((ch = inReaderGBK.read()) != - 1 ) {
             outWriterUTF8.write(ch);
         }
 
     }
}

在上面的代码中,"gbk.txt"  文件是使用GBK编码,而 "人类简史.txt" 文件是使用utf-8;我们使用转换流把gbk编码格式的文件转换成了utf-8编码格式的文件。原理如下:

1、读取 "gbk.txt" 的时候,先读取的是字节,然后根据我们指定的编码集去查找字典,因此可以读取出正确的字符;

2、而在写入 "人类简史.txt" 文件的时候,字符先是经过了转换流,转换流接收到了字符,看了一下自己被指定为utf-8格式的,所以就去查编码集,把接收到的字符转换成了utf-8编码的格式,然后写入了文件;

3、over。

猜你喜欢

转载自blog.csdn.net/wdsdads/article/details/79672149