【爬虫】微信读书笔记如何导出到本地?

前言

我在微信读书APP上看了一些书,但很多都只是过了一遍,看完了也就忘了。这对于专业书籍来说,读一遍相当于没读,所以把自己做的笔记导出来看看增强记忆,是很有必要的。

遗憾的是微信读书APP只提供了将笔记复制到剪切板,然后粘贴到其他地方,而PC端版本连剪切的功能都没有,更不用说导出了。更为操蛋的是这个APP支持选择的笔记条数是有限的,如果笔记做得多的话,你得分好几次选择导出,而且要找到上次选择的位置。作为中国最大的互联网公司的核心产品之一,这种简单的需求都满足不了,我只能忍住爆粗口。

于是,我在网上找了个别人开发的爬虫工具,将自己的微信读书笔记内容导了出来,简要记录下。

实践

1. 爬虫工具准备
Github上的源码:https://github.com/arry-lee/wereader,Python3写的,将其克隆到本地。
使用方法都有简单说明:

  • 浏览器打开 https://x.weread.qq.com
  • 微信扫码登录确认,提示没有权限忽略即可
  • F12 获取 Cookie 字符串拷贝到 settings.py
  • Cookie 一段时间就会失效 必须重新登录获取

2.获取cookie
这步是关键,关于怎么获取,可见这个回答:https://jingyan.baidu.com/article/5d368d1ea6c6e33f60c057ef.html
。我使用的是第一种方法获取cookie
image.png

3.导出笔记
使用任意一个IDE,我用的Pycharm,新建一个工程,打开脚本,先在settings.py中设置好刚拷贝的cookie,如下:
image.png

设置好后,运行client.py程序即可,可根据自己需求修改脚本,导出笔记保存,笔记导出的格式可以是markdown
image.png

image.png

不过我发现,这个工具导出的内容并不全面,有些我明明是做了笔记却没有导出。而且它导出的章节顺序是反的,这可就一点也不友好了。当然,可以在作者脚本的基础上修改,后续有时间再看看。

原文地址:https://www.cnblogs.com/jessepeng/p/12273604.html