计算机世界 --- 字符

1. 基本概念

1.1 字符

人们所使用的记号,抽象意义上的符号(包括文字、字母、数字、标点符号)。

1.2 字符集

就是特定字符的集合。(如ASCII字符集、ISO 8859字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等)

1.3 字符编码

字符集中字符对应的二进制编码。(如ANSI字符集对应的就是ANSI码)

1.4 编码

规定每个字符分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做编码。(如UTF-8、UTF-16、UTF-32等)

各个国家和地区在制定编码标准的时候,字符集和编码一般都是同时制定的。因此,平常我们所说的字符集,除了有字符集这层含义外,同时也包含了编码的含义。(注意:Unicode字符集有多种编码方式,其他的字符集一般都只有一种)

所有的编码都是将字符转化为字节的过程。

参考资料:

http://polaris.blog.51cto.com/1146394/377468/
http://www.regexlab.com/zh/encoding.htm

原文地址:https://www.cnblogs.com/roddy/p/6760782.html