爬虫学习研究

百度、新浪、网易这仨的登录js,百度代码乱,新浪好点,网易好赞。然后在Python里借助nodejs运行核心加密的js代码,或者直接翻译js到py里,模拟登录成功了。顺带登陆了 知乎、CSDN、github一票网站。
网易虽然js代码漂亮,不过认证加密方式还挺复杂的,有兴趣可以试着玩下。破了网易,其他的就是小case了。不过没研究过QQ和淘宝,应该比网易更复杂

看到知乎 Knight 说的话。后续可以按照这种难度学习爬虫

新浪微博com

新浪微博cn

原文地址:https://www.cnblogs.com/fangyuandoit/p/13713841.html