python基础--编码

内存中使用unicode编码

>>> 'u4e2du6587'   
'中文'
>>> x=b'ABC'

用指定编码方式编码字符串

>>> 'ABC'.encode('ascii')
b'ABC'

>>> '中文'.encode('utf-8')

b'xe4xb8xadxe6x96x87'

>>> '中文A'.encode('utf-8')
b'xe4xb8xadxe6x96x87A'

注：

①b'...'里一个字符代表一个字节

②b'...A...'里面的A表示一个字节，代表assci码中A的编码

将字节转成字符串

>>> b'ABC'.decode('ascii')
'ABC'
>>> b'xe4xb8xadxe6x96x87'.decode('utf-8')
'中文'

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

第一行告诉Linux系统，这是一个Python可执行程序，Windows系统会忽略这个注释；

第二行告诉Python解释器，按照UTF-8编码读取源代码，否则，你在源代码中写的中文输出可能会有乱码。

申明了UTF-8编码并不意味着你的.py文件就是UTF-8编码的，必须并且要确保文本编辑器正在使用UTF-8编码：