1.初始编码
- 电脑的传输,还有存储的实际都是01010100011 这样的二进制字符
- 8位bit == 1个字节byte
- 美国:ASCII码 只能显示英文,数字和特殊字符,为了解决这个全球化的文字问题,创建了一个万国码 -- unicode
- 最开始
- 1个字节 表示所有的英文,数字和特殊字符等等
- 2个字节,6位表示一个中文,不够, unicode 一个中文用四个字节表示:32位 太浪费资源所以有了改进
- 中文9万多字
- 升级版:UTF-8 一个字节 表示英文,数字和特殊字符, 欧洲国家:用两个字节 16位 中文用3个字节24位
- gbk: 国内使用,一个 中文用两个字节表示,不全面
## 目前主流用UTF-8
## 数据在内存中表示是用 unicode
## 文件存储,传输是用其他的编码方式:utf-8 / bgk