JS字符编码----ASCII,Unicode 和 UTF-8

转:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

1.ASCII 码

八个二进制位就可以组合出256种状态,这被称为一个字节(byte)

使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号, 以及在美式英语中使用的特殊控制字符。

其中最后一位用于奇偶校验。

2.Unicode

Unicode能够表示全世界所有的字节,Unicode最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)

 
utf8是对unicode字符集进行编码的一种编码方式

ASCII编码是1个字节,而Unicode编码通常是2个字节
 
UTF-8 是 Unicode 的实现方式之一

3.GBK

GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。

4. charset/encoding

  Charset (Character set) 字符集: 是对字符抽象表示的集合。包括世界上各种文字、符合和字符。i.e. unicode

  Encoding (Charset Encoding) 字符编码:建立字符集合和计算机系统对应的规则。简单来说就是,

  将字符转化为计算机可识别的二进制编码的规则。i.e. utf-8

列表如下:

http://ascii.911cha.com/

https://www.ssec.wisc.edu/~tomw/java/unicode.html#x0000

欢迎指正批评!!!
原文地址:https://www.cnblogs.com/ljyqd/p/11096800.html