Java IO: 其他字符流(下)

作者: Jakob Jenkov 译者: 李璟(jlee381344197@gmail.com)

本小节会简要概括Java IO中的PushbackReader，LineNumberReader，StreamTokenizer，PrintWriter，StringReader，StringWriter。

PushbackReader

PushbackReader与PushbackInputStream类似，唯一不同的是PushbackReader处理字符，PushbackInputStream处理字节。代码如下：

1
PushbackReader reader = new PushbackReader(new FileReader("c:\data\input.txt"));

2
 
3
int data = reader.read();

4
 
5
reader.unread(data);

同样可以设置缓冲区大小，代码如下：

1
PushbackReader reader = new PushbackReader(new FileReader("c:\data\input.txt"), 8);

LineNumberReader

原文链接

LineNumberReader是记录了已读取数据行号的BufferedReader。默认情况下，行号从0开始，当LineNumberReader读取到行终止符时，行号会递增(译者注：换行，回车，或者换行回车都是行终止符)。

你可以通过getLineNumber()方法获取当前行号，通过setLineNumber()方法设置当前行数(译者注：setLineNumber()仅仅改变LineNumberReader内的记录行号的变量值，不会改变当前流的读取位置。流的读取依然是顺序进行，意味着你不能通过setLineNumber()实现流的跳跃读取)。代码如下：

01
LineNumberReader reader = new LineNumberReader(new FileReader("c:\data\input.txt"));

02
 
03
int data = reader.read();

04
 
05
while(data != -1){

06
 
07
    char dataChar = (char) data;

08
 
09
    data = reader.read();

10
 
11
    int lineNumber = reader.getLineNumber();

12
 
13
}

如果解析的文本有错误，LineNumberReader可以很方便地定位问题。当你把错误报告给用户时，如果能够同时把出错的行号提供给用户，用户就能迅速发现并且解决问题。

StreamTokenizer

原文链接

StreamTokenizer(译者注：请注意不是StringTokenizer)可以把输入流(译者注：InputStream和Reader。通过InputStream构造StreamTokenizer的构造函数已经在JDK1.1版本过时，推荐将InputStream转化成Reader，再利用此Reader构造StringTokenizer)分解成一系列符号。比如，句子”Mary had a little lamb”的每个单词都是一个单独的符号。

当你解析文件或者计算机语言时，为了进一步的处理，需要将解析的数据分解成符号。通常这个过程也称作分词。

通过循环调用nextToken()可以遍历底层输入流的所有符号。在每次调用nextToken()之后，StreamTokenizer有一些变量可以帮助我们获取读取到的符号的类型和值。这些变量是：

ttype 读取到的符号的类型(字符，数字，或者行结尾符)

sval 如果读取到的符号是字符串类型，该变量的值就是读取到的字符串的值

nval 如果读取到的符号是数字类型，该变量的值就是读取到的数字的值

代码如下：

01
StreamTokenizer tokenizer = new StreamTokenizer(new StringReader("Mary had 1 little lamb..."));

02
 
03
while(tokenizer.nextToken() != StreamTokenizer.TT_EOF){

04
 
05
    if(tokenizer.ttype == StreamTokenizer.TT_WORD) {

06
 
07
        System.out.println(tokenizer.sval);

08
    } else if(tokenizer.ttype == StreamTokenizer.TT_NUMBER) {

09
 
10
        System.out.println(tokenizer.nval);

11
 
12
    } else if(tokenizer.ttype == StreamTokenizer.TT_EOL) {

13
 
14
        System.out.println();

15
 
16
    }

17
 
18
}

译者注：TT_EOF表示流末尾，TT_EOL表示行末尾。

StreamTokenizer可以识别标示符，数字，引用的字符串，和多种注释类型。你也可以指定何种字符解释成空格、注释的开始以及结束等。在StreamTokenizer开始解析之前，所有的功能都可以进行配置。请查阅官方文档获取更多信息。

PrintWriter

原文链接

与PrintStream类似，PrintWriter可以把格式化后的数据写入到底层writer中。由于内容相似，不再赘述。

值得一提的是，PrintWriter有更多种构造函数供使用者选择，除了可以输出到文件、Writer以外，还可以输出到OutputStream中(译者注：PrintStream只能把数据输出到文件和OutputStream)。

StringReader

原文链接

StringReader能够将原始字符串转换成Reader，代码如下：

01
Reader reader = new StringReader("input string...");

02
 
03
int data = reader.read();

04
 
05
while(data != -1) {

06
 
07
    //do something with data...

08
 
09
    doSomethingWithData(data);

10
 
11
    data = reader.read();

12
 
13
}

14
 
15
reader.close();

StringWriter

原文链接

StringWriter能够以字符串的形式从Writer中获取写入到其中数据，代码如下：

1
StringWriter writer = new StringWriter();

2
 
3
//write characters to writer.

4
 
5
String data = writer.toString();

6
 
7
StringBuffer dataBuffer = writer.getBuffer();

toString()方法能够获取StringWriter中的字符串数据。

getBuffer()方法能够获取StringWriter内部构造字符串时所使用的StringBuffer对象。

原创文章，转载请注明： 转载自并发编程网 – ifeve.com本文链接地址: Java IO: 其他字符流(下)