字符串和编码问题

字符‘0’和整数0 ASCII编码是不一样的。

Unicode把所有语言统一到一套编码里,这样就不会出现乱码问题。

但是Unicode通常用两个字节表示,ASCII码中只有大小写英文字符和一些特殊符号,一般用一个字节就可以表示。

英文也用Unicode会造成占用不必要的空间,需要存储多一倍的空间,会造成不必要的下载和上传速度减缓。

后来,对Unicode进行了缩排,出现了UTF-8编码。UTF-8编码把Unicode按照数字大小划分成了六个字节。英文通常为一个字节,汉字通常为三个字节。

在计算机内存中统一使用Unicode编码,当需要传输或者保存到硬盘的时候转换为UTF-8。

记事本编辑:从文件中读取的时候,UTF-8转换成Unicode,编辑完成后,保存的时候,Unicode转换成UTF-8.

浏览网页:浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器。

ord() 获取字符的整数表示。ord(‘A’) 整数表示为65.ord(‘中’)整数表示为20013.

chr() 将整数转换成对应的字符。chr(65) 字符为‘A’,chr(20013)字符为‘中’。

知道字符的整数编码,可以用十六进制表示。‘u4e2d’   (中的整数编码是20013)。

原文地址:https://www.cnblogs.com/Roc-Atlantis/p/8334821.html