python 的文件编码处理

python的文件编码处理有点粗鲁

1.不管文件原来是编码类型,读入后都转换成Unicode的编码

2.写入文件时,write函数把变量以读入文件的编码方式写入(根据open(path,mode,encoding='utf-8')里的encoding,这个的utf-8只是举个例子,如果encoding未赋值,责根据解释器默认的文件读入编码模式来编码),(举个例子:读入文件是gbk编码,处理过程是用Unicode处理,处理完 了会转成gbk保存。这些事儿都是python默默的做的)

3.如果想中途转换编码格式,encode就是将Unicode编码成目标编码格式的二进制码,decode就是将有编码格式的二进制码转换成Unicode,所以在python的中间处理过程中,在处理的只有Unicode编码格式的数据。

4.py文件保存磁盘的编码方式在file-settings-editor-file encoding-project encoding(pycharm)

5.pycharm控制台输出的解码方式是在file-settings-editor-file encoding-global encoding(pycharm)

粗鲁而简单

encoding目前可以的赋值,utf-8

                                           utf-16

                                          gbk

原文地址:https://www.cnblogs.com/mghhzAnne/p/10396868.html