制作采集器采集网站内注意几点

1.编码必须统一。数据库编码,文件编码,将取得的数据插入数据库,等等。都要和要被采集的网站的编码一样。

2.在写正则匹配的时候,写匹配模式时必须转移双引号""(如:\"\")和斜杠"/"(如:<\/a>)。

3.需要耐心进行调试切不可操之过急!

原文地址:https://www.cnblogs.com/yuwensong/p/2939180.html