字符编码与转码

Python3中默认的字符编码为Unicode,可以直接encode为其他编码

python2中默认为windows下的gbk,所有得非Unicode都要先decode为Unicode,然后再encode为其他的字符编码。

借图

import sys
print(sys.getdefaultencoding()) #显示字符编码
a_unicode="夫风起于青萍之末" #这个是unicode格式
print(a_unicode)
a_gbk=a_unicode.encode('gbk')   #默认是unicode格式,转化为gbk格式
print(a_gbk)
a_gb2312=a_gbk.decode('gbk').encode('gb2312')   #先decode转化为unicode格式,括号里告诉自己是gbk格式的,再encode转化,括号里写要转化的格式。
print(a_gb2312) #gbk是gb2312升级版,常用汉字的编码基本相同
a_unicode2=a_gbk.decode('gbk')    #转化为unicode格式
print(a_unicode2)
原文地址:https://www.cnblogs.com/dcc001/p/5758115.html