Python编码格式

1,编码有很多种,中国的GB2312,美国的ASCII码,日本的Shift-JIS等等。在存储时,所占的字节识是不一样的,比如:中国的GB2312占两个字节,美国的ASCII占一个字节

2,国际上便统一了一种编码:Unicode占两个字节,这样就导致有的国家不同意。

3,所以会又发明了UTF-8,该编码是可变字长的编码格式,表示字母用一个字节,表示汉字用两个字节

4,这样的话,基本上我们在写代码,或者文本时,都是以UTF-8来存储,但是加载到内存后,这些东西会被解释成为Unicode的编码形式,再转化为二进制。

原文地址:https://www.cnblogs.com/lpfworld/p/9332636.html