3 -11 字符编码与转换

中文的字符编码  是 gbk   windows 默认的字符编码也是gbk

每个国家都有自己的字符编码 为了 统一 就有了

unicode

##unicode 不管英文中文都占 2个字节  16位

ascii码 一个英文一个字节  不能存中文。。 8 位 英文 或特殊字符

转换后 中文 变成3个字节

其中utf-8 是  Unicode的 可变长度的扩展级

 encode 是编码    decode  是 解码   

import sys
print(sys.getdefaultencoding())
### 查看系统编码是 什么

utf-8 转换成  gbk

1,首先你要去Unicode 里告诉 它  我是 utf-8    decode()解压

2  然后再编码成 gbk 格式 显示

gbk 转换 utf-8

1,首先去unicode 里告诉自己是 gbk       decode('gbk')

2 , 然后再编码成 utf-8  展现       encode('utf-8')


 增加点内容 

python  默认走 unicode   

如果是 gbk 格式的    

首先需要声明 自己是 gbk ---告诉 unicode 我是 gbk--编码 --utf8

原文地址:https://www.cnblogs.com/th-lyc/p/8545366.html