字符串和编码问题

字符‘0’和整数0 ASCII编码是不一样的。

Unicode把所有语言统一到一套编码里，这样就不会出现乱码问题。

但是Unicode通常用两个字节表示，ASCII码中只有大小写英文字符和一些特殊符号，一般用一个字节就可以表示。

英文也用Unicode会造成占用不必要的空间，需要存储多一倍的空间，会造成不必要的下载和上传速度减缓。

后来，对Unicode进行了缩排，出现了UTF-8编码。UTF-8编码把Unicode按照数字大小划分成了六个字节。英文通常为一个字节，汉字通常为三个字节。

在计算机内存中统一使用Unicode编码，当需要传输或者保存到硬盘的时候转换为UTF-8。

记事本编辑：从文件中读取的时候，UTF-8转换成Unicode，编辑完成后，保存的时候，Unicode转换成UTF-8.

浏览网页：浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器。

ord() 获取字符的整数表示。ord（‘A’）整数表示为65.ord（‘中’）整数表示为20013.

chr（）将整数转换成对应的字符。chr（65）字符为‘A’，chr（20013）字符为‘中’。

知道字符的整数编码，可以用十六进制表示。‘u4e2d’ （中的整数编码是20013）。