Parser b2c

HTML-Parser-master 搞不好就死循环 解析太慢
/html/body/table[3]/tr/td[3]
/table
第一行第二行工作不正常
/tr[1]/td[1]/text()作者
/tr[1]/td[2]/table/tr/td[1]/a/text()名字
/tr[1]/td[2]/table/tr/td[1]/font/text()名字
/tr[1]/td[3]/text() 时间
/tr[2]/td[1]/font/text() 楼
/tr[2]/td[2]/text()
https://github.com/sandbil/HTML-Parser/

~
http://www.raysoftware.cn/ 解析快 css表达式不支持[1..n]选元素
html body >table ~table ~table table

internettools-master fpc lazarus 乱码问题tp.parseTree(ls.Text,'','charset=gb2312'{load}{memo2.Lines.Text});如此解决 默认是(fpc)utf8
/html/body/table[3]/tr/td[3]
问题发生情况说明
t:= TEncoding.GetEncoding(936);
memo2.Lines.LoadFromFile('topic.asp@topicid=178029-u8',T);
当我读取后 文本在memo2的状态是UTF8
完事html里面 charset=gb2312 。。所以乱码了。
当我把文件的gb2312 替换成utf8后 文件保存依然是936 加载也是936
乱码消失 ,,噗~
//tp.TargetEncoding:=CP_UTF8;
//strEncodingFromName 在这返回编码格式 显然,这个框架定制程度比较高。需要手改

原文地址:https://www.cnblogs.com/marklove/p/14801225.html