UTF-8

UTF-8 编码是一种被广泛应用的编码,

采用变长度字节来表示字符,理论上最多可以到 6 个字节长度,

例如两位字节字符编码样式为为:110xxxxx 10xxxxxx;六位字节字符的编码样式为:1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx。 xxx 的值由字符编码的二进制表示的位填入

原文地址:https://www.cnblogs.com/tiange-137/p/14602544.html