包含中文的文本文件解码原则

先解出是Unicode还是ASCII,unicode常见的是utf-8。ascii常见的有gb2312和gbk,都是ascii的扩展,gbk包括gb2312和ascii的所有字符集,gb2313包括ascii的所有字符集,所以统一按gbk解码,没错的。

原文地址:https://www.cnblogs.com/nanfei/p/8962249.html