python的编码问题

python2与python3编码的区别

相信让很多人苦恼的就是python2的编码问题了,但是还好,python3中所有的编码都成了utf-8了,再也不用再顶部加上

 #--*--coding:utf-8 --*--  这个了

 

编码史

先说一下ASCII码:他有8位,发明他的人天真的以为8位就可以表示所有的东西,但是随着时代发展,8位明显不足,这时候就出现了万国码(Unicode)编码,它至少用16位来表示东西,但是对于数字来说,16位明显显的有点多余了,出现了空间浪费问题,为了解决这一问题,utf-8(gbk等)编码随之而产生了,都是在Unicode的基础上优化存储方式,减少了空间的浪费问题。

那么对于utf-8 和gbk这样一同级语言怎样相互转换呢?

没错!utf-8与gbk都是对Unicode的基础上优化而来的,所以他俩可以通过Unicode作为中间媒介从而达到编码转化的目的

python2和python3的编码和解码

python2中由于所有的都是Unicode编码所以存在Unicode向utf-8的编码(encode)以及utf-8到Unicode的解码(decode)过程但是在python3中由于都是utf-8 的编码形式,所以只存在编码过程;但是在编码之间的转化如utf-8 到gbk的过程内部也是通过Unicode来转化的

原文地址:https://www.cnblogs.com/bluesl/p/9021784.html