文件处理-智能检测编码的工具(chardet)

一.chardet使用方法

问:假如你不知道你要处理的文件是什么编码可怎么办呢?

import chardet

f = open('通讯录.txt',mode='rb')
data = f.read()
f.close()

result = chardet.detect(data)
print(result)

输出:

{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}

上述代表此文件是用GB2312编码的,并且是中文,正确的概率是0.99

二.chardet的安装

Linux和Windows下都可以使用pip3来安装(Windows在cmd命令行下)

pip3 install chardet
原文地址:https://www.cnblogs.com/wushuaishuai/p/8431807.html