黄聪:抓取网页链接的php类:snoop

官方地址:http://sourceforge.net/projects/snoopy/

作用:Snoopy is a PHP class that simulates a web browser. It automates the task of retrieving web page content and posting forms, for example.

翻译(个人):Snoopy是一个用php写的一个模拟浏览器运行的一个类,他会主动获取网页内容,发送表单等。

我最中意的是需要获取一个网页全部链接功能。

<?      
include "Snoopy.class.php";      
$snoopy = new Snoopy;      
$snoopy->fetchlinks(http://www.blogguy.cn);      
print_r($snoopy->results);      
?>   

其他的功能如抓取文字(去html)等功能没有测试。

原文地址:https://www.cnblogs.com/huangcong/p/2610157.html