初始编码

1.初始编码

- 电脑的传输,还有存储的实际都是01010100011 这样的二进制字符

- 8位bit == 1个字节byte

- 美国:ASCII码  只能显示英文,数字和特殊字符,为了解决这个全球化的文字问题,创建了一个万国码 --  unicode

- 最开始

  - 1个字节 表示所有的英文,数字和特殊字符等等

  - 2个字节,6位表示一个中文,不够, unicode 一个中文用四个字节表示:32位  太浪费资源所以有了改进

- 中文9万多字

- 升级版:UTF-8 一个字节 表示英文,数字和特殊字符,  欧洲国家:用两个字节 16位  中文用3个字节24位

- gbk: 国内使用,一个 中文用两个字节表示,不全面

## 目前主流用UTF-8

## 数据在内存中表示是用 unicode

## 文件存储,传输是用其他的编码方式:utf-8 / bgk

原文地址:https://www.cnblogs.com/li-code/p/10639336.html