字符编码解码

二进制

  ASCII :只能存英文和拉丁字符,一个字符占一个字节,8位

    gb2312:只能存6700多个中文, 1980

      gbk1.0:存了2万多字符,     1995

        gb18030:2000, 27000中文

  unicode:utf-32:一个字符占4个字节

  unicode:utf-16:一个字符占2个字节或2个以上,65535

  unicode:utf-8:一个英文用ASCII码来存,一个中文占3个字节

编码(encode)

解码(decode)

in python2

默认是ASCII码

原文地址:https://www.cnblogs.com/evatan123/p/9206293.html