Python学习之路Day1:字符编码

字符编码的区别与介绍

ASCII、GB2312、GBK、Unicode(统一码、万国码、单一码)

ASCII码1个字节占8个比特币,Unicode统一2个字节占16个比特币;

utf-8是Unicode的子集,可变长,所有的英文单词存的是ASCII码格式,中文字符是3个字节。

ASCII 255 1bytes---> 1980年 GB2312  7K+ ----> 1995年 GBK1.0 2W+ --->2000年 GB18030 2.7W ---> unicode 2bytes---> utf -8 en:1bytes,zh:3bytes

Python 3 默认支持中文, Python 2 默认ASCII码,不支持中文。

# -*- coding:utf-8 -*- 限定字符编码格式

--------------------------------------------------------------------------------

name = "你好,世界" print(name)

# -*- coding:utf-8 -*-

原文地址:https://www.cnblogs.com/xiaobai005/p/7677880.html