利用后裔采集器快速采集文本数据(以京东为例)

1.对于列表类型的网页

对于有分页功能的网页,要抓取列表中的数据,可以点击“自动识别”,软件会尝试自动识别列表。

如果自动识别效果不符合您的要求,您可以通过“手动点选列表”来修改识别结果

手动点选列表的操作步骤如下:

第一步:点击“手动点选列表”的选项

第二步:点击网页中列表的第一行的第一个元素

第三步:点击网页中列表的第二行的第一个元素

2.出现未提取到有效数据的问题处理方法

解决方案:

首先进行预处理,需要先进行一步点击操作

技巧:点击查看网页

参考文献:
http://www.houyicaiji.com/?type=post&pid=888

原文地址:https://www.cnblogs.com/luckyplj/p/13805091.html