java网络爬虫爬虫小栗子

简要介绍:

  使用java开发的爬虫小栗子,存储到由zookeeper协调的hbase中

  主要过程是模拟Post请求和get请求,html解析,hbase存储

  源码:https://github.com/husky00/worm/tree/master/ViewNoticeContent

  注:maven 3.3.9 构建的项目,内附较为详细的开发和使用说明,请勿用作不和谐用途!

原文地址:https://www.cnblogs.com/husky/p/6322855.html