day02 Python 字符串编码

  Python2.X中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 #coding=utf-8 就行了;Python3.X 源码文件默认使用utf-8编码,所以可以正常解析中文,无需指定 UTF-8 编码。

  1. ASCII 8bit 1byte
  2. GBK 16bit 2byte
  3. Unicode 32bit 4byte
  4. UTF-8 可变长度的unicode.  英文: 8bit 1byte; 欧洲文字; 16bit 2byte; 中文 :24bit 3byte
原文地址:https://www.cnblogs.com/fanghongbo/p/9812477.html