Python(二)学习笔记||一、字符集和编码

1. 计算机存的是二进制,我们平时使用的汉字都不是二进制,存在计算机里用的是字符编码。

2. 字符集就是一套文字符号及其编码的描述。字符集有很多种。

3. 概念:

  A. 位:计算机中的最小单位,二进制中的一位,用0/1表示。(比特)

  B. 字节:八位组成一个字节。(一个汉字可以是两个或三个字节)

  C. 字符:我们肉眼可见的文字或符号。(一个汉字是一个字符,一个英文字母是一个字符)

  D. 字符集:字符的集合。

  E. 编码:将字符转换成计算机可以识别的0/1代码。

  F. 解码:将计算机表示的0/1编码转换成肉眼可见的字符。

4. 编码:

  ASCII:

  GB2312:收录7千多简体汉字

  GBK:收录2万多汉字(流行)

  GB18030:另加了少数民族的文字

  UCS:所有字符采用四个字节进行编码,

  UTF-8:对不同范围的字符使用不同长度的编码

  UFT-16:以16位无符号整型数据为单位的

  

原文地址:https://www.cnblogs.com/Lixinhang/p/11039123.html