java 编码转换

在网络中爬取到的数据,编码可能与当前编译器的编码不相同,而导致可能产生显示乱码的问题。那么如何将网络的编码,转换为当前编译器认可的编码(一般为UTF-8),就是个问题了。

主要使用了两个方法:

String.getBytes("编码类型"):表示将String编码转换成相应的编码。

String.getBytes():表示转换成操作系统默认的编码。

String.getBytes("utf-8"):表示将String转换成UTF-8编码。

最后使用:

new String(str,"UTF-8");表示该str以什么编码方式显示。

所以将一个GBK编码的string转换成UTF-8的步骤是:

String str = "你好"  //gbk

String str = new String(str.getBytes("utf-8"),"utf-8");//就转换过来了

原文地址:https://www.cnblogs.com/rookiechen/p/6133654.html