day6-1

字符编码与解码:

Unicode  默认都占两个字符,用ASCII码英文占一个字节,ASCII码不能存中文

Unicode 存放英文会浪费空间

utf-8 存放时因为是一个字节,中文三个字节

unicode  -------->通过编码 encode  转换为其他编码

其他编码   ————>  解码decode  为  unicode

 1 a = "时间煮雨"
 2 print(a)
 3 print(a.encode("utf-8"))
 4 print(a.encode("utf-8").decode("utf-8"))
 5 print(a.encode("utf-8").decode("utf-8").encode("gbk"))
 6 print(a.encode("utf-8").decode("utf-8").encode("gbk").decode("gbk"))
 7 
 8 
 9 '''
10 时间煮雨
11 b'xe6x97xb6xe9x97xb4xe7x85xaexe9x9bxa8'
12 时间煮雨
13 b'xcaxb1xbcxe4xd6xf3xd3xea'
14 时间煮雨
15 '''
View Code

python 3中系统默认编码是Unicode,并且使用encode编码后会变成 bytes类型,python3文件编码是utf-8 但python 3 中信息是unicode编码

可以通过-*- coding:gbk -*- 修改文件编码

原文地址:https://www.cnblogs.com/yfjly/p/9715907.html