Python编码

默认编码:

python3里默认编码是unicode

unicode 分为 utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节), 所以utf-16就是现在最常用的unicode版本, 不过在文件里存的还是utf-8,因为utf8省空间

转换方法:

在进行编码转换时,需要先解码(decode())成Unicode,再进行编码(encode())

如果需要将 ISO-8859-1 转换为 UTF-8 ,由于 ISO-8859-1 是单字节编码,与 UTF-8 不同无法转换,需要先转换为 GBK。

在py3中encode,在转码的同时还会把string变成bytes类型,decode在解码的同时还会把bytes变回string

详细文章:点击此处

原文地址:https://www.cnblogs.com/dbf-/p/10572765.html