InputStreamReader解决读取文本中文乱码

创建一个txt文本,文本采用的编码格式是ANSI,首先FileInputStream从a.txt文件读取,并且一个字节一个字节传给InputStreamReader,当返回三个字节时(UTF-8是三个字节为1个汉字),FileInputStream就去UTF-8表中找所对应的中文汉字。结果显而易见,所以出现乱码.所以要将“UTF-8"设置为"GBK”,或者将txt文本的编码格式改为UTF-8

 1  /**
 2      * http://127.0.0.1:8080/zifuliu/du
 3      * 字符流,输入流,读
 4      * 高效流
 5      * @return
 6      * @throws IOException
 7      */
 8     @RequestMapping("/du")
 9     public String du()throws IOException {
10         //使用默认编码
11         InputStreamReader inputStreamReader = new InputStreamReader(new FileInputStream("D:/aaa.txt"),"utf-8");
12         BufferedReader bufferedReader = new BufferedReader(inputStreamReader);
13         String str;
14         StringBuilder stringBuilder = new StringBuilder();
15         while ((str=bufferedReader.readLine())!=null){
16             System.out.println("====>字符流:"+str);
17             stringBuilder.append(str);
18         }
19         bufferedReader.close();
20         return stringBuilder.toString();
21     }

gbk和utf-8区别?

区别:GBK主要用于中文编码,包含全部中文字符,utf8包含全世界所有国家需要用到的字符;utf8比较灵活,长度在1-6个字节,GBK的长度为2个字节,和GBK相比,utf8会占用更多的数据库存储空间。

原文地址:https://www.cnblogs.com/BoKe-LY/p/13553391.html