TinyHtmlParser开源喽

优点:  高效、简单、易用的Html解析器。 
学习时间,分分钟。 
解析速度超过,查找速度超快,支持格式化。 
有强悍的容错性,即使HTML标签不规范,也会尽可以进行匹配,弥补,正确纠错率达95%以上。即使不能正确纠错,也不会导致解析不下去。 
支持大小写混合匹配,即开始标签与结束标签为<HTML>和</html>也可以正确的进行匹配。 
Maven引用坐标: 

1 <dependency>
2 <groupId>org.tinygroup</groupId>
3 <artifactId>htmlparser</artifactId>
4 <version>0.0.12</version>
5 </dependency>




使用方式,请参考http://my.oschina.net/tinyframework/blog/194574 
只要把文中的Xml变成Html就完全适用。

原文地址:https://www.cnblogs.com/j2eetop/p/4612469.html