Java I/O输入输出流

一、编码问题

文本文件其实就是字节序列，可以是任意编码的字节序列，如果我们在中文机器上直接创建文本文件，那么该文本文件只能解析默认的ansi编码

转换成字节序列用的是项目默认的编码GBK，GBK编码中文占用2个字节，英文占用1个字节

UTF-8编码中中文占用3个字节，英文占用1个字节

Java是双字节编码，UTF-16BE编码，中文占用2个字节，英文占用2个字节

字符串转化为字节时可以指定编码方式：

        String s ="中国";
        byte[] byte1= s.getBytes("gbk");

当你的字节序列是某种编码时，这时候想把字节序列变成字符串，也需要用这种编码方式，否则会出现乱码。如下说明编码方式

String str1 = new String(bytes1,"utf-16be");

如果没有指明编码方式，则用项目默认的编码GBK

每个project可以设置自己默认的编码方式，且只认识自己的编码方式

二、File类的使用

java.io.File类用于表示文件（目录）

File类只用于表示文件（目录）的信息（名称、大小等），不能用于文件内容的访问

文件的创建

        File file = new File("d:\javaIo");//要使用双斜杠\
        if(!file.exists())//判断文件存不存在
            file.mkdirs();//创建多级文件目录，file.mkdir()只创建一级目录
        else
            file.delete();//删除文件、文件夹

File file2 = new File("d:"+File.separator+"javaIo"+File.separator+"file2.txt");//File.separator设置分隔符，各个系统都能够识别
File file3 = new File("d:\javaIo","日记.txt");//两种方式都可以
if(!file2.exists())
            try {
                file2.createNewFile();//创建文件
            } catch (IOException e) {
                e.printStackTrace();
            }

常用的File的API

System.out.println(file);//file.toString()的内容

System.out.println(file.getAbsolutePath());
System.out.println(file.getName());
System.out.println(file2.getName());
System.out.println(file.getParent());//父目录的路径

File类的常用操作

/**
     * 列出指定目录下（包括其子目录）的所有文件
     */
    public static void listDirectory(File dir) throws IOException{
        if(!dir.exists())
            throw new IllegalArgumentException("目录："+dir+"不存在");
        if(!dir.isDirectory())
            throw new IllegalArgumentException(dir+"不是目录");
      
        File[] files = dir.listFiles();
        if(files!=null&&files.length>0){
            for (File file : files) {
                if(file.isDirectory())
                    FileUtils.listDirectory(file);//递归方式遍历目录下所有文件
                else
                    System.out.println(file);
            }
        }
    }

注意：file.listFiles()方法获取到的是File，所以打印输出是完整的目录

而file.list()方法获取到的是String，打印输出的只是文件的名称，要打印完整目录需要加上父目录

三、RandomAccessFile的使用

RandomAccessFile是Java提供的对文件内容的访问类，既可以读文件，也可以写文件。支持随机访问文件，可以访问文件的任意位置

(1)Java的文件模型

在硬盘上的文件是byte byte byte存储的，是数据的集合

(2)打开文件

有两种模式“rw”）(读写)“r”(只读)

RandomAccessFile = new RandomAccessFile(file,"rw");

文件指针，打开文件时指针在开头，pointer = 0;

(3)写方法

raf.write(int)---->只写一个字节（后8位），同时指针指向下一个位置，准备再次写入

raf.write(byte数组) 可以写入整个数组

(4)读方法

int b = raf.read()--->读一个字节

如果用raf.read(byte数组) 可以读取全部

(5)文件读写完成一定要关闭

四、字节流的使用

(1)InputStreamOutputStream

InputStream抽象了读取数据的方式

OutputStream抽象了写数据的方式

(2)EOF = End 读到-1就读到结尾

(3)输入流基本方法

int b = in.read();读取一个字节，无符号填充到int低八位，-1是EOF

in.read(byte[] buf)读取数据填充到字节数组buf中

in.read(byte[] buf,int start, int size)

(4)输出流基本方法

out.write(int b) 写出一个byte到流，b的低8位

out.write(byte[] buf)将buf 字节数组都写入到流

out.write(byte[] buf,int start, int size)

(5)FileInputStream

子类，具体实现了在文件上读取数据

/**
     * 读取指定文件内容，按照16进制输出到控制台
     * 并且每输出10个byte换行
     * @param fileName
     */
    public static void printHex(String fileName) throws IOException{
        
        FileInputStream in = new FileInputStream(fileName);
        int b;
        int i=1;
        while((b=in.read())!=-1){
            System.out.print(Integer.toHexString(b&0xff)+"  ");
            if((i++)%10==0)
                System.out.println();
        }
        in.close();//读取完毕记得一定要close
        
    }

        FileInputStream in = new FileInputStream(fileName);
        byte[] buf = new byte[20*1024];
        //从in 中批量读取字节，放入到buf这个字节数组中，从第0个位置开始放，最多放buf.length个
        //返回的是读到的字节的个数
        int bytes = in.read(buf, 0, buf.length);//一次性读完，说明字节数组足够大

数组不够大时，有可能一次文件读不完，则需要在外面加上while((bytes = in.read(buf, 0, buf.length))!=-1)，这样才能保证读到完整的文件

byte类型8位，int类型32位，为避免数据转换错误，通过&0xff将高24位清零

(6)FileOutputStream

实现了向文件中写出byte数据的方法

FileOutputStream(File file,boolean append)

如果该文件不存在，则直接创建

如果该文件存在，为ture,则向文件中追加内容，如果没写或为false，删除后再创建

(7)DataOutputStream/DataInputStream

对“流”功能的扩展，可以更加方便的读取int,long,字符等类型的数据

DataOutputStream

writeInt()/writeDouble()/writeUTF(),只是包装好了可以直接用

(8)BufferedInputStream&BufferedOutputStream

这两个流类为IO提供了带缓冲区的操作，一般打开文件进行写入或读取时，都会加上缓冲，这种流模式提高了IO的性能

从应用程序中把输入放入文件，相当于将一缸水倒入到另一个缸中：

FileOutputStream--->write()相当于一滴一滴的把水转移到水缸里

DataOutputStream--->writeXxx()方便一些，相当于一瓢一瓢的将水转移过去

BufferedOutputStream--->write更方便，相当于一瓢水一瓢水先放入桶中，再从桶中倒入到水缸里

批量读取（使用数组方式，先把文件内容存在数组中），效率最高！！！高了不止一点点

public static void copyFile(File srcFile, File destFile) throws IOException {
        if (!srcFile.exists())
            throw new IllegalArgumentException("文件" + srcFile + "不存在");
        if (!srcFile.isFile())
            throw new IllegalArgumentException(srcFile + "不是文件");
        FileInputStream in = new FileInputStream(srcFile);
        FileOutputStream out = new FileOutputStream(destFile);
        byte[] buf = new byte[8 * 1024];
        int b = 0;
        while ((b = in.read(buf, 0, buf.length)) != -1) {
            out.write(buf, 0, b);
            out.flush();// 最好加上
        }
    }

要记得刷新缓冲区 .flush

五、字符流的使用

(1)编码问题

(2)认识文本和文本文件

Java的文本（char）是16位无符号整数，是字符的unicode编码（双字节编码）

文件是byte byte byte的数据序列

文本文件是文本（char）序列按照某种编码方案（utf-8，utf-16be，gbk）序列化为byte的存储结果

(3)字符流（reader，writer）--->操作的是文本文件，其他文件类型用字符流没有意义

字符的处理，一次处理一个字符

字符的底层仍然是基本的字节序列

字符流的基本实现，默认为gbk

InputStreamReader 完成byte流解析为char流，按照编码解析

OutputStreamWriter 提供char流到byte流，按照编码处理

FileReader/FileWrite用于文件的读写

(4)字符流的过滤器

BufferedReader--->readLine一次读一行 String line，

BufferedWriter/PrintWrite--->写一行

不认识换行，需要单独写出换行.newLine()

六、对象的序列化和反序列化

(1)对象序列化，就是将Object转换成byte序列，反之叫对象的反序列化

(2)序列化流（ObjectOutputStream），是过滤流--->writeObject

反序列化流（ObjectInputStream）--->readObject

(3)序列化接口（Serializable）

对象必须实现序列化接口 implements Serializable，才能进行序列化，否则将出现异常

接口没有任何方法，只是一个标准

(4)transient关键字

用于不想序列化的元素

用transient修饰的元素不会进行jvm默认的序列化，但可以自己完成元素的序列化

(5)父类和子类

一个类实现了序列化接口，那么其子类都可以进行序列化

对子类对象进行反序列化操作时，如果其父类没有实现序列化接口，那么其父类的构造函数会被调用，如果其父类实现了序列化接口，则其父类的构造函数不会被调用