PAIP.获取RSS全文输出.txt


PAIP.获取RSS全文输出.txt


有些站点非RSS全文输出..可以使用以下五种方法 ...但经过我的亲自试用,效果不佳..大约只有50%的成功率..

1.まるごとRSS,
2.FeedEx ,
3.利用 fivefilters 的full-text rss
4.借助Yahoo Pipes
5.在 Google Reader


只好亲自动手,写了断源码,解析RSS中LINK,然后利用HTTPCLIENT将其下载下来...效果达到了100%成功率..很不错.呵..分享一下,将其上传至网

站..http://www.hahasfc.com

使用方法 http://www.hahasfc.com/rssfulltxt.jsp?url=http://www.msn.com/rss/mustsee.aspx (全文FEED地址)
将其url参数改为源RSS FEED地址就可以了..

http://www.msn.com/rss/mustsee.aspx是MSN的一个FEED地址,只输出了摘要..经过这么来转换,就得到了全文的FEED...

目前有待于改进的地方:
1.因为是实时抓取网络IO,所以速度有点慢.
2.未分析文章内容,直接将其HTML页面抓过来了.呵.



-----参考
5种获取RSS全文输出的方法 帕兰映像.htm

Powered by Zoundry

原文地址:https://www.cnblogs.com/attilax/p/15200072.html