Unicode编码

1. Unicode编码

  Unicode字符集(UCS-2)---->Unicode码(2 Bytes)。对于汉字的编码,事实上Unicode对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万 多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字 也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用 4个字节来编码字符。

  一般说的Unicode编码指的是这种UCS-2编码

原文地址:https://www.cnblogs.com/iamswf/p/4564217.html