编码的初识py

编码:
"北京烤鸭降价了"
对照表:密码本
0000001 北
0000100 京
0010110 烤
0010101 鸭

0010100 0101100 10101

ASCII:最早版本的'密码本'.
8位 == 1 个字节。
0000 0001 256可能,代表256个不同的字符。
ABC:
01000001 01000010 01000011
一个字符:1个字节表示。
'hello': 5个字节

万国码:Unicode,将世界上所有国家的文字都包含进来。
起初:16位 两个字节表示一个字符。
a: 01000001 01000001
中:01000101 01000001
升级:32位 四个字节表示一个字符。
a: 01000001 01000001 01000001 01000001
中:01000101 01000001 01000001 01000001
浪费资源,空间。

utf-8:最少用8位,一个字节表示一个字符。
a:01000001 一个字节
欧洲文字: 01000001 01000001 两个字节
亚洲 中 :01000001 01000001 01000001 三个字节。

gbk: 国标,只包含ASCII,中文。
a: 01000001 一个字节
中:01000001 01000001 两个字节。

s1 = '老男boy'
# gbk 编码:7个字节。
# utf-8 编码:9个字节。

单位转换:
8bit == 1 bytes
1024bytes == 1 kb
1024kb == 1MB
1024MB = 1Gb
1024GB = 1TB
1024TB = 1PB
努力到无能为力,拼搏到感动自己。
原文地址:https://www.cnblogs.com/jin-yuana/p/9832096.html