Python处理编码汉字的一些方法收集

# x编码转换为汉字
python2:
str1='xe6xb6xa6xe4xb9x8b'
print unicode(str1,'utf-8')

python3:
str2=b'xe6xb6xa6xe4xb9x8b'
print(str2.decode())


# u编码转换为汉字
python2:
str1='u6da6u4e4b'
print str1.decode('unicode_escape')

python3:
str2='u6da6u4e4b'
print(str2.encode('utf-8').decode('utf-8')) // .decode('unicode_escape') 这样不对
注:如果只是输出,直接 print(str2) 就能正确输出中文

# 生成编码(python 2/3 通用)

>>> u'润之'.encode('unicode_escape')
b'\u6da6\u4e4b'
>>> u'润之'.encode('utf-8')
b'xe6xb6xa6xe4xb9x8b'

原文地址:https://www.cnblogs.com/rangeon/p/13774072.html