python入门:字符编码

字符编码

字符编码:字符----编码(字符编码表)---->二进制

目前内存中使用的统一是unicode,编码和解码对应了相应的字符集

保证不乱码的关键:

1.字符当初以什么编码存放的, 就应该以什么编码解码。

当存储的时候字符编码不对的时候,内存会存放错误的二进制,那么取出来的时候,无论以什么办法取,都是乱码

2.在python2中解释器默认使用的编码是ASCII码,python3默认使用的是UTF-8

在python文件头上插入:
#coding:utf-8
修改python解释器的编码格式
#这个是读取的时候用什么编码(pycharm读取是什么编码,写入就是什么编码,比较方便。)

3.目前很多软件默认编码是UTF-8,windows上默认的是GBK,选择好字符集非常重要

#python程序在windows cmd上可以出结果,但是python2显示乱码,是因为cmd是gbk,python2是utf-8
#如果想在python2也使用python3一样的将代码转换成unicode,在代码将加入一个u
a=u'丁'  #赋值丁给a,存入内存为unicode,这样所有的平台都不会乱码了

更详细请看: https://www.cnblogs.com/linhaifeng/articles/5950339.html

原文地址:https://www.cnblogs.com/dinghc/p/12221771.html