20171012 动态爬虫爬取预约挂号有号信息

  1. -- 目标:针对医院有些医生有预约号不确定时间点有号,晚了就挂不到了,能有个监测爬去,有号就提醒的机制。

可能会用到:scrapy + PhantomJS + Selenium

环境: windows10 + vs 2015 + python 2.7

安装 : scrapy

创建项目: 命令提示符 界面 使用语句 scrapy startproject s_scrapy

成功后会提示创建的目录地址

cd s_scrapy

进入目录

tree /f

树形结构读取目录文件

在vs中创建一个python的项目,再增加现有文件s_scrapy到项目中,这样所有的项目文件都导入了,方便操作

 下载PhantomJS ,Windows环境下载好后,解压得到PhantomJS.exe

放到cmd可以执行的路径下面,再通过cmd 执行语句phantomjs ./test.js http://baidu.com

当然了./test.js   路径要对,可以自己改

-- python 2.7 安装selenium 目的是为了调用PhantomJS 这种没有界面的浏览器,来实现交互功能

也许并不是你需要的内容,这只是我人生的一些痕迹. -- soar.pang
原文地址:https://www.cnblogs.com/Soar-Pang/p/7654512.html