字符编码

前置知识点:
一、程序执行的三大核心硬件(***):
cpu
内存
硬盘
正常执行一个程序的要点:
1、将硬盘中的数据读到内存

2、由cpu读内存中的数据进行执行

3、在执行程序的时候,生成的数据,优先存入内存

二、python解释器执行一个py文件过程(***)

如果没有python解释器,py文件单纯就是一个文本文件
所以说,想执行py文件,必须先执行python解释器

1、将python解释器的代码由硬盘读到内存
2、将py文件以普通文本文件的格式由硬盘读到内存
3、python解释器去内存中读取py文件的数据
4、识别python语法,执行相应的操作

ps:任何一个文本编辑器的执行,前两部都一样

需要掌握:
1、用户无论输入什么字符,存入内存,unicode都可以兼容
2、硬盘中无论是什么编码的文件,读到内存,都可以兼容unicode

数据的传输:
优先以自己的本国字符编码进行传递


必须掌握:(******)
(内存)unicode二进制字符 >>> 编码(encode) >>> (硬盘)UTF-8二进制字符
(硬盘)UTF-8二进制字符 >>> 解码(decode) >>> (内存)unicode二进制字符


保证不乱码核心:(******):
用什么编码存的数据,就用什么编码取

----------------------------------------
python2 :
默认的字符编码ASCII码(因为当时的unicode还没盛行)
python3:
默认的字符编码UTF-8

文件头:
# coding:UTF-8
用英文字符,是为了让所有的计算机都可以识别


pycharm默认的字符编码是:
UTF-8
中国的windows操作系统默认字符编码:
GBK

原文地址:https://www.cnblogs.com/huahongzhenghexiu/p/11815715.html