8.python中字符串的编码和解码问题——decode/encode

              python默认的是不支持中文的,要想让python识别中文,就必须在文件头加上

#-*-coding:UTF-8-*-

              这样,python默认的编码格式就会采用utf-8的格式了。

               实际工作中,我们可能会遇到需要将unicode编码形式转换到其他编码形式的问题,解决方法如下:

#-*-coding:UTF-8-*-
a_string='深入python'
by=a_string.decode('utf-8')             #因为python的编码格式已经改成了utf-8,所以,第一步就是要解码,得到解码后的对象

a=by.encode('gb18030')	             #解码后,我们就可以用其他的编码格式进行编码了,编码得到一个str对象

a=a.decode('gb18030')		    
a=a.encode('big5')
a=a.decode('big5')

python内部用unicode对象来表示字符串,和人交互的时候用str对象,str对象是经过了编码的对象。所以,在改变字符串编码时,必须先解码。

原文地址:https://www.cnblogs.com/chenjianhong/p/4145136.html