Java基础知识（JAVA之IO流）

学习Java IO，不得不提到的就是JavaIO流。

流是一组有顺序的，有起点和终点的字节集合，是对数据传输的总称或抽象。即数据在两设备间的传输称为流，流的本质是数据传输，根据数据传输特性将流抽象为各种类，方便更直观的进行数据操作。

IO流的分类

根据处理数据类型的不同分为：字符流和字节流

根据数据流向不同分为：输入流和输出流

Java流操作有关的类或接口：

字符流和字节流

字符流的由来：因为数据编码的不同，而有了对字符进行高效操作的流对象。本质其实就是基于字节流读取时，去查了指定的码表。字节流和字符流的区别：

（1）读写单位不同：字节流以字节（8bit）为单位，字符流以字符为单位，根据码表映射字符，一次可能读多个字节。

（2）处理对象不同：字节流能处理所有类型的数据（如图片、avi等），而字符流只能处理字符类型的数据。

（3）字节流在操作的时候本身是不会用到缓冲区的，是文件本身的直接操作的；而字符流在操作的时候下后是会用到缓冲区的，是通过缓冲区来操作文件，我们将在下面验证这一点。

结论：优先选用字节流。首先因为硬盘上的所有文件都是以字节的形式进行传输或者保存的，包括图片等内容。但是字符只是在内存中才会形成的，所以在开发中，字节流使用广泛。

输入流和输出流

对输入流只能进行读操作，对输出流只能进行写操作，程序中需要根据待传输数据的不同特性而使用不同的流。

1.缓冲流

缓冲字节流
BufferedInputStream
BufferedOutputStream
缓冲字符流
BufferedReader
BufferedWriter
处理流内部包含了节点流，节点流决定了与其沟通的外部设备，而处理流则增加了其功能。
缓冲流的好处：
缓冲流内部包含一个缓冲区域，默认8kb，每一次程序调用read方法其实都是从缓冲区域当中读取内容，如果读取失败
就说明缓冲区域当中没有内容，那么就从数据源当中读取内容，然后会尽可能读取更多的字节放入到缓冲区域当中，
最后缓冲区域当中的内容，会全部返回给程序。
从缓冲区读取数据会比直接从数据源读取数据的速度快，效率也更高，性能更好。
简单说：
没有缓存区，那么每read一次，就会发送一次IO操作；有缓存区，第一次read时，会一下读取x个字节放入缓存区，
然后后续的read都会从缓存中读取，当read到缓存区末尾时，会再次读取x个字节放入缓存区。
处理流处理数据和节点流处理数据的方法基本上完全相同。
2,转换流：

转换流作用：把字节流转换成字符流，可以解决出现的因为编码集和解码集造成的乱码问题。
* InputStreamReader:
* OutputStreamWriter:
* 编码：字符—–编码字符集——–》二进制
* 解码：二进制—解码字符集———》字符
* 在处理文件时，如果文件的字符格式和编译器处理格式不一样时，会出现乱码问题。比如文件字符格式GBK，
* 而编译器是UTF-8格式，那么就会产生该问题。
*
* 出现乱码问题的原因：
* 1.编码和解码字符集不一致造成了乱码
* 2.字节的缺失，长度的丢失
*
* 大部分情况下，出现乱码问题是因为中国汉字，因为中国汉字在不同的字符编码当中占据的字节数不相同，但是都占据多个字节。
* 而英文字母没有这个问题，因为英文字母在所有的字符编码当中都占据一个字节。
InputStreamReader :转换输入流–》将字节输入流转换成字符输入流
作用：为了防止文件使用字符输入流处理时出现乱码问题。

节点流：

字节数组流（内存流）
ByteArrayInputStream
ByteArrayOutputStream
因为内存输出流当中又新增的方法，不能使用多态，不能够让父类的引用指向之类的对象。
作用：可以在循环当中把所有的数据存放到统一的容器当中，然后在循环结束之后可以把容器当中所有的内容一起取出来。
注意事项：
内存流属于内存当中的资源，所以数据量不要过大，如果太大，会造成内存溢出的错误。

数据处理流：

DataOutputStream
DataInputStream
特点：既能够保存数据本身，又能够保存数据类型（基本数据类型+String）

序列化流：

将对象转换成字节序列的过程，就是对象序列化过程。
* 将字节序列恢复为对象的过程称之为对象的反序列化。
*
* 作用：保留对象（引用数据类型数据的）类型+数据。
*
* 序列化流：输出流 ObjectOutputStream writeObject()
* 反序列化流：输入流 ObjectInputStream readObject()
*
* 注意事项：
* 1。先序列化然后在反序列化，而且反序列化的顺序必须和序列化的顺序保持一致。
* 2.并不是所有的对象都能够被序列化。只有实现了Serializable接口的类的对象才能够被序列化。
* 对象当中并不是所有的属性都能够被序列化。
*
* 对象序列化的主要用途：
* 1.把对象转换成字节序列，保存到硬盘当中，持久化存储，通常保存为文件。
* 2.在网络上传递的是对象的字节序列
*
* 对象序列化的步骤：
* 1.创建对象输出流，在构造方法当中可以包含其他输出节点流，如文件输出流。
* 2.把对象通过writeObject的方式写入。
*
* 对象反序列化的步骤：
* 1.创建对象输入流，在构造方法当中可以包含其他的输入节点流，如文件输入流
* 2.通过readObject()方法读取对象。

serialVersionUID :序列化版本id
* 作用：从字面角度看，就是序列化版本号。凡是实现了Serializable接口的类，
* 都会有一个默认的静态的序列化标识。
*
* 1.类在不同的版本之间，可以解决序列化兼容问题，如果之前版本当中在文件中保存对象，
* 那么版本升级后，如果序列化id一致，我们可以认为文件中的对象依然是此类的对象。
*
* 2.如果类在不同的版本之间不希望兼容，但是还希望类的对象能够序列，那么就在不同版本中
* 使用不同的序列化id。
*
* transient :当类中有属性不想被序列化，那么就使用这个修饰符修饰。

---------------------
作者：yangm_1111
来源：CSDN
原文：https://blog.csdn.net/eternal1d/article/details/77189482
版权声明：本文为博主原创文章，转载请附上博文链接！