java网络爬虫基础学习(二)

正则表达式

正则表达式写法 含义
d 代表0-9的任意数字
D 代表任何非数字字符
s 代表空格类字符
S 代表非空格类字符
p{Lower} 代表小写字母[a-z]
p{Upper} 代表大写字母[A-Z]
p{Alpha} 代表字母
p{Blank} 代表空格或制表符

HTTP状态码

分类 描述
1** 信息,服务器收到请求,需要请求者继续执行操作。
2** 成功,操作被成功接收并处理。
3** 重定向,需要进一步的操作已完成请求。
4** 客户端错误,请求包含语法错误或无法完成请求。
5** 服务器错误,服务器在处理请求的过程中发生了错误。
原文地址:https://www.cnblogs.com/fmqdblog/p/10739325.html