python解压zip包中文乱码解决方式

乱码得原因:

由于ZipFile模块导出遇到中文解码不对,windows上会出现,linux是否会出现不知道没测试过。

解决方式:

1. 搞个文件名引射表(不太方便,少量文件夹套用时候还可以)

2. 修改源码解码格式(不太方便,自己搞了一下,之后报其他错误)

3. 自己写入文件,自己创建文件夹(推荐)

自己创建的写法:

        with zipfile.ZipFile(file=zip_save_path, mode='r') as zf:
            # 解压到指定目录,首先创建一个解压目录
            os.mkdir(unzip_dir_path)
            for old_name in zf.namelist():
                # 获取文件大小,目的是区分文件夹还是文件,如果是空文件应该不好用。
                file_size = zf.getinfo(old_name).file_size
                # 由于源码遇到中文是cp437方式,所以解码成gbk,windows即可正常
                new_name = old_name.encode('cp437').decode('gbk')
                # 拼接文件的保存路径
                new_path = os.path.join(unzip_dir_path, new_name)
                # 判断文件是文件夹还是文件
                if file_size > 0:
                   # 是文件,通过open创建文件,写入数据
                    with open(file=new_path, mode='wb') as f:
                        # zf.read 是读取压缩包里的文件内容
                        f.write(zf.read(old_name))
                else:
                    # 是文件夹,就创建
                    os.mkdir(new_path)

结果正常:

原文地址:https://www.cnblogs.com/zezhou/p/13359750.html