ASCII、Unicode、UTF-8、GBK 区别

python2内容进行编码(默认ASCII),而python3对内容进行编码的默认为UTF-8。

ASCII

       最多只能用8位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号。不支持中文

Unicode(万国码)

    UCS -2 是使用2个字节  

    UCS -4 是使用4个字节   

UTF-8

       万国码的升级版

       一个中文字符=三个字节、英文是一个字节、欧洲的是2个字节、亚洲3个字节

GBK

       国标

       一个中文字符=2个字节、英文是一个字节

GBK转UTF-8需通过媒介Unicode

原文地址:https://www.cnblogs.com/1oo88/p/11425421.html