编码进阶

s1 = 'taibai'
s2 = b'taibai'
print(s1,type(s1))
print(s2,type(s2))

s3 = '太白金星'
s4 = '太白金星'.encode('utf-8')
print(s3, type(s3))
print(s4, type(s4))

bytes类型和str是孪生兄弟,str有的功能,bytes也都有

实例:

s1 = b'alex'
print(s1.capitalize())

# str ---> bytes  编码 encode()
s1 = 'alex'
b1 = s1.encode('utf-8')  # 编码
b2 = s1.encode('gbk')
print(s1, type(s1))
print(b1, type(b1))
print(b2, type(b2))

中文形式的

s1 = '太白'
b1 = s1.encode('utf-8')
b2 = s1.encode('gbk')
print(s1,b1)
print(s1,b2)

bytes ---> str  decode()解码
b1 = b'xe5xa4xaaxe7x99xbd'
s1 = b1.decode('utf-8')
print(s1)

#必须使用utf-8,如果使用gbk就报错了。

b1 = b'xe5xa4xaaxe7x99xbd'
s1 = b1.decode('gbk')
print(s1)



作者:wangkaiok —— 小菜鸟111

出处:http://www.cnblogs.com/wangkaiok/

本文版权归作者和博客园共有,但未经作者同意禁止转载,转载必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

原文地址:https://www.cnblogs.com/wangkaiok/p/9869579.html