字符串的编码

1.ASCII  一个英文字母占用一个字节 无法表示汉字

2unicode 编码 每个字符占用两个字节,可以表示汉字,但对于英文字母来说会造成存储空间的浪费

3 utf-8可变长度的编码 对于英文占用一个字节 汉字占用三个字节 其它生僻的字符占用4-6个字节

把一个文件中的内容读取到内存最好转化为unicode编码   保存文件的时候把它转化为utf-8编码

4python3在内存当中将所有字符以unicode编码保存

python2在linux下字符默认编码asci

用python2编写python文件 文件中的内容如果有中文 需要在文件开头写上 #_*_coding:utf-8_*_  在python3中则不需要

  

原文地址:https://www.cnblogs.com/doctorXiong/p/8569754.html