Python字符集

字符集:

美国:ASCII      需要8bit表示     英文字母一个字节,不支持中文
中国:GBK                           英文字母一个字节,汉字占两个字节
万国:unicode     需要16bit表示    统一占两个字节,统一编码,但是对于用不了这么2个字节的国家(比如美国)显然更浪费空间
变长:utf-8                        美国占一个字节,欧洲占两个字节,亚洲占三个字节

PS:
1)python2不支持中文,因为他用的ASCII编码的
2)1bytes=8bit
3)字符就是计算机里能表示的一个一个单独的个体,比如一个汉字,一个字母,一个数字都是一个字符,跟编码没有关系,
    在计算机和电信技术中,一个字符是一个单位的字形、类字形单位或符号的基本信息.
  字节是计算机用于计量存储容量的单位.因为不同的字符集定义存储的规则不同,
    所以不同的字符在不同的编码环境所消耗的存储容量不同,即所占字节数不同.
原文地址:https://www.cnblogs.com/duoduoyichen/p/10192347.html