python基础六之编码

  python中编码的特点:

    1,各个编码之间的二进制是不能互相识别的,会产生乱码

    2,文件的储存和传输是不能用Unicode的

python3的编码

  在python3中字符串在内存中是用Unicode编码的,而要完成储存和传输则要将str转换为bytes类型。bytes的操作方式和str相同,但是它的编码和str不同,可以是utf-8,gbk,gb2312等等。

  str →  bytes的方法是str.encode(编码方式)

# encode() 表现形式是将str转变为bytes 编码方式是将Unicode转换为utf-8,gbk,gb2312等等
# 英文,数字和特殊字符转换为bytes后前面加了个b
s = 'zxc'
print(s.encode('utf-8'))  # b'zxc'

# 中文
s = '蔠缬草'
print(s.encode('utf-8'))  # b'xe8x94xa0xe7xbcxacxe8x8dx89'

  bytes  → str的方法是bytes.decode()

# decode 解码
s = ''
b = s.encode('utf-8')  # 编码
print(b)
print(b.decode('utf-8'))  # 解码

  

原文地址:https://www.cnblogs.com/zxc-Weblog/p/8080069.html