nodejs实战：小爬虫

var http=require('http');
var url='http://www.website.com/path';
http.get(url,function(res){
    var html='';
    res.on('data',function(data){
        html+=data;
    })
    res.on('end',function(){
        //对HTML进行处理，取出自己有用的内容
    })
}).on('error',function(e){
    console.log('读取网页错误，Error: '+e.message);
})

对读取出来的元素进行处理可以用cheerio模块或则正则表达式

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/zhenxianluo/p/6062698.html

推荐文章
Oracle基础（八）数据完整性
Oracle基础（七）数据表
Java Script基础（十二）正则表达式
Java Script基础（十一）表单验证
Java Script基础（十）访问样式表
Java Script基础（九）下拉列表对象
Java Script基础（八） Array数组对象
Java Script基础（七） HTML DOM模型
Java Script基础（六） DOM模型
WinForm多线程编程与Control.Invoke的应用浅谈
sql查询job
linux下安装apache
SQL Server：查看数据库用户权限（SQL 2005）
VNC连接黑屏的问题
windows 2008下远程连接 redhat linux 9桌面
linux下vi命令大全
mysql在linux中安装问题和命令
mysql备份和还原命令
MySQL Installation of system tables failed!
Linux系统运行级与启动机制剖析
【基础知识七】贝叶斯分类器
tensorflow入门资料
机器学习常用开发工具【转】
SVM的sklearn.svm.SVC实现与类参数
从线性回归到CNN【转】
RBF神经网络和BP神经网络的关系
sklearn安装
【转】SQL模糊查询
笔记：XML-解析文档-流机制解析器（SAX、StAX）
笔记：XML-解析文档-XPath 定位信息