teleport使用说明

 

 
 
teleport使用说明

浏览器下载网页:
只能浏览主页和少数网页,其它不能浏览,容量几百kb

teleport下载项目一
能完全离线看网页,7328多文件 9个JPG文件,大小134M


teleport下载项目二
部分网页采集内容和项目一基本一致,但大几兆
部分网页需要项目二(复制站点)才能浏览,项目一看不到图片
项目二比项目一耗时多,但要全面

视频教程
https://www.youtube.com/watch?v=qt0az3mPK3s


https://www.youtube.com/watch?v=RWB7tS_NdqI

YouTube

How to use Teleport Pro (Footprinting and Reconnaissance)





图片

离线浏览,网站镜像,文件提取工具

遍历网站的所有链接网址,网站关键字搜索


1. 复制一个可浏览的网站,文件存放在硬盘
2.复制一个网址,包括文件结构
3.在网址搜索指定文件
包括声音,食品,背景图片,zip等等。这种方式速度快。
4.遍历网址所有链接,不会写任何文件到硬盘,此速度很快
5.指定网址下载文件,爬虫不会去其它链接
6.搜索网站关键词
图片

图片



(算法)工作原理:
1.把开始网址作为起点
2.遍历所有链接
3.对每个链接下载文件
4.重复判断

爬虫很灵活,很多参数可以自己设定。
爬虫有记忆功能,不会采集重复链接或文件
图片




项目测试
1.抓取一个网址的所有链接
选择遍历网址所有链接,不会写任何文件到硬盘,此速度很快
详细资料可以看到链接信息:
图片


可以看到网站的树状结构
图片


项目:选择第一项,创建一个可浏览的网站副本
打开所在文件夹,搜索index,就是主页,双击就可浏览

图片






终止测试:
终止后,项目被放弃,如果再次启动项目,会重新开始


暂停测试
暂停后,
项目被放弃,如果再次启动项目,会重新开始





脚本之家项目2测试,
下载的网页不全,有点打不开




工标网不能每页采集,此软件功能有限,寻找新的软件


原文地址:https://www.cnblogs.com/webRobot/p/5219337.html