Unicode编码相关概念

1.Unicode是一种字符映射方案,这种映射并不是编码(即还没有到二进制机器码层面),而是像一个电话本一样,把全世界所有语言使用的字符,都映射成一个"u+"开头的数字(在JAVA中,除了映射表中最后一个字符u+10400,都可以使用以"u"开头的单个java char来表示);

2.将Unicdoe字符映射到机器码的编码方案有UTF-8和UTF-16;

(1)UTF-8:是一种变长的编码方案,在0~127之间的Unicode码将会使用一个字节来编码(并且这个映射和ASCⅡ相同),超过127的用2个或4个字节;

(2)UTF-16:固定使用2个或4个字节。

3.Unicode只是一个字符到数字的映射的标准,它对支持的字符数量没有限制;

4.永远记得通过Content-Type或者meta charset便签来显式指定你的文档的编码,这样浏览器就不会猜测你使用什么编码而造成编码错误。

参考:http://www.freebuf.com/articles/others-articles/25623.html

原文地址:https://www.cnblogs.com/huiAlex/p/8182691.html