python基础学习7----编码与解码

一.python2

python2中默认以ASCII编码

str='hello world'
gbk_to_unicode=str.decode('gbk')#将gbk解码为unicode
print(gbk_to_unicode)
unicode_to_utf-8=gbk_to_unicode.encode('utf-8')#将unicode编码为utf-8
print(unicode_to_utf-8)

二.python3

python3文本默认是以Unicode编码

str='hello world'
unicode_to_gbk=str.encode('gbk')
print(unicode_to_gbk)#此处输出为byte类型的gbk编码的内容,即在编码的同时将字符串转换成了byte类型
gbk_to_utf-8=unicode_to_gbk.decode('utf-8')#此处在解码的同时将byte转换成了字符串
print(gbk_to_utf-8)

编码就是将字符串转变为byte,解码就是byte转变为str,str是unicode,byte具体看以什么类型编码的

 gbk编码中汉字占2个字节,utf8中占3个字节

感觉此处内容有些复杂,不敢确认上述内容是否正确,还请路过的前辈补充指点。

原文地址:https://www.cnblogs.com/sfencs-hcy/p/9539651.html