编码

编码

ascii

A 00000010 8位一个字节

uncode

A 000000000 00000001 00000010 00000100 32位

中000000000 00000001 00000010 00000110 32位

utf-8

A 0010 0000 8位一个字节

中 000000000 00000010 00000110 24位三个字节

gbk

A 00000110 8 位一个字节

中 00000010 00000110 16位两个字节

1.各个编码之间的二进制，是不能相互认识的，会产生乱码

2.文件的储存，传输，不能是uncode，只能是（ascii gbk gb2312 utf- 8 utf-16）

python3 的str编码就是uncode

　　　　　bytes类型使用gbk和utf-8等

对于英文

　　　　　str表现形式

　　　　　　str="feaf"

　　　　　编码方式

　　　　　　 uncode 01010101

　　　　bytes 表现形式

　　　　　　bytes=b"fafe"

　　　　编码方式 00101010 utf-8 gbk

对于中文

　　　　str表现形式

　　　　　　str="中文"

　　　　　编码方式

　　　　　　 uncode 01010101

　　　　bytes 表现形式

　　　　　　bytes=b"/fef"#看不懂

　　　　编码方式 00101010 utf-8 gbk

　　　　

　　　　str="fhahjf"

　　　　s22=str.encode("utf-8")#encode把str转化成bytes

　　　　print(s22)

　　　　s2=str.encode("gbk")#encode把str转化成gbk（bytes）

　　　　print(s2)

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/648071634com/p/11647126.html