【python学以致用】给PDF添加书签目录,Python解析书签JSON python王者归来 带书签版

前言:

  最近学习python,找的电子书基本没有目录,发现文泉试读里面有目录 就抱着试试 找了找,很快找到了目录文件 是json文件,但并不知道如何解析。于是一直放着。

  2020年5月26日学习了 python 列表、for、字典的皮毛等相关知识。勉强解决问题。  

  python解析这里应该会有更好的方法,但我目前根据自己学到只能这样做啦。愿意分享的可以分享下。谢谢

步骤:

  网上有借鉴,但借鉴的教程在寻找目录方面比较麻烦,因此没有马上行动。之后才有了上面的找目录的发现。

  一、提取目录

  二、使用 PdgCntEditor 软件添加目录

  三、检测检查目录

 

一、提取目录

  1、找到对应电子书文泉试读——  打开审查元素——   network——  搜索到目录相关文字 找到目录json  

   

  

  2、双击自动选中 可以直接打开 复制 或者 复制链接下载都行。

   

   

  3、然后看到是这样一个数据。

  

  4、接着用到刚学的python基础知识

  桌面存放刚刚保存的json数据 json.txt

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*-
 3 import json
 4 # 读取数据
 5 with open(r'C:UsersHAPPYDesktopjson.txt', 'r', encoding="utf-8") as f:
 6     load_dict = json.load(f)
 7 json_len = len(load_dict["data"])
 8 for i in range(0, json_len):
 9     json_label = load_dict["data"][i]["label"]
10     json_pnum = load_dict["data"][i]["pnum"]
11     print(json_label, json_pnum)
12     if "children" in load_dict["data"][i]:
13         json_len_children = len(load_dict["data"][i]["children"])
14         for z in range(0, json_len_children):
15             children_json_label = load_dict["data"][i]["children"][z]["label"]
16             children_json_pnum = load_dict["data"][i]["children"][z]["pnum"]
17             print(children_json_label, children_json_pnum)

 二、使用 PdgCntEditor 软件添加目录

  1、先打开软件 打开需要添加的目录 然后把刚刚python解析的目录复制到空白 

  全选目录文字  点击   自动切分页码

 

   2、这里的目录 和电子书基本是核对得上的。

  基准页就是PDF 打开的第一页,要和目录对应。

  确定后保存

  

  3、不用目录排版 也行,我这里目录只有1级,多级目录就点下缩进排版 。软件具体操作看上面参考链接

 三、检测目录 (ok 没有问题)

原文地址:https://www.cnblogs.com/WLEWXY/p/12965434.html