python-编码

字符串在python3的内存中是以Unicode(32位)编码的

utf-8  

一个英文字母占1个字节,一个汉字占3字节

gbk

一个英文字母占1个字节,一个汉字占2字节

编码转换

方法一

s='liming'

s1=s.encode('utf-8')    #将字符串转换成指定编码

s1=s.encode('gbk')

liming b'liming'

方法二

s1=bytes(s,encoding='utf-8') #将字符串转换成指定编码

或者  s1=bytearray(s,encoding='utf-8')

python3严格区分bytes和bytearray,bytes是不可变数据类型,而bytearray像名称一样可使用append等方法

编码转换成字符

s2=s1.decode()  

s1是编码

s2是字符串

encode是编码   decode是解码】

原文地址:https://www.cnblogs.com/liming19680104/p/10928724.html