编码

ascii

A : 00000010 8位一个字节

unicode A : 00000000 00000001 00000010 00000100 32位四个字节

中：00000000 00000001 00000010 00000110 32位四个字节

utf-8 A : 00100000 8位一个字节

中 : 00000001 00000010 00000110 24位三个字节

gbk A : 00000110 8位一个字节

中 : 00000010 00000110 16位两个字节

1，各个编码之间的二进制，是不能互相识别的，会产生乱码。

2，文件的储存，传输，不能是unicode（只能是utf-8 utf-16 gbk,gb2312,asciid等）

py3:

str 在内存中是用unicode编码。

bytes类型

对于英文：

str ：表现形式：s = 'alex'

编码方式： 010101010 unicode

bytes ：表现形式：s = b'alex'

编码方式： 000101010 utf-8 gbk。。。。

对于中文：

str ：表现形式：s = '中国'

编码方式： 010101010 unicode

bytes ：表现形式：s = b'xe91e91e01e21e31e32'

编码方式： 000101010 utf-8 gbk。。。。