编码进阶

s1 = 'taibai'
s2 = b'taibai'
print(s1,type(s1))
print(s2,type(s2))

s3 = '太白金星'
s4 = '太白金星'.encode('utf-8')
print(s3, type(s3))
print(s4, type(s4))

bytes类型和str是孪生兄弟，str有的功能，bytes也都有

实例：

s1 = b'alex'
print(s1.capitalize())

# str ---> bytes  编码 encode()

s1 = 'alex'
b1 = s1.encode('utf-8')  # 编码
b2 = s1.encode('gbk')
print(s1, type(s1))
print(b1, type(b1))
print(b2, type(b2))

中文形式的

s1 = '太白'
b1 = s1.encode('utf-8')
b2 = s1.encode('gbk')
print(s1,b1)
print(s1,b2)

bytes ---> str  decode()解码

b1 = b'xe5xa4xaaxe7x99xbd'
s1 = b1.decode('utf-8')
print(s1)

#必须使用utf-8，如果使用gbk就报错了。

b1 = b'xe5xa4xaaxe7x99xbd'
s1 = b1.decode('gbk')
print(s1)

作者：wangkaiok —— 小菜鸟111

出处：http://www.cnblogs.com/wangkaiok/

本文版权归作者和博客园共有，但未经作者同意禁止转载，转载必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。