编码与解码

无论是编码后还是解码后,都是一串字节。

通用语言

编码,解码,必须至少要有一种共同的语言,也就是共同的编码方式,这个通用语言(也是一种字符编码)即是 Unicode
接下来所谓的编码,解码。

编码

将通用语言(Unicode编码)表示的字符(串)重新按另一种编码表示,生成另外一组字节序列。
如,Unicode编码表示下的,abcde,假如为12345,按GBK编码来,处理完后,可能就是45678这一组字节,总之,编码后即为GBK规则下的字节数组。

解码

将所拿到的字节数组,按照对应的编码格式解码还原为Unicode,比如在GBK下面查规则4代表a,5代表b,拿到abcde后,再用Unicode表示,12345,解码完成后为Unicode下的字节数组。

原文地址:https://www.cnblogs.com/lxzbky/p/13289940.html