Python笔记:编码问题

1. python2的编码:

  python2中使用的是ASCII码,所以不支持中文,如果要在python2中写入中文编码,需要在文件头编写:

#-*- encoding:utf-8 -*-

2. 不同编码介绍

  1,ASCII:最早的编码,里面有英文大写字母,小写字母,数字,一些特殊字符,没有中文。8个bit,1个byte。

       2,GBK:中文国标码,里面包含了ASCII编码,16个bit,2个byte。

  3,unicode:万国码,里面包含了全世界所有国家的文字编码,32个bit,4个byte,包含了ASCII。

  4,UTF-8:可变长度的万国码,是unicode的一种实现,最小字符占8位

            英文:8bit  1byte

    欧洲文字:16bit  2byte

    中文:24bit  3byte

原文地址:https://www.cnblogs.com/heshike/p/10492659.html