织梦入门2-采集1

文章数据库

标题在dede_archives里
内容在dede_addonarticle里

织梦采集的临时内容在dede_co_htmls表里

dede_arctiny表存储文章的ID,一般会因为这个表报找不到模版错误

如果在一件更新的更新所有中报文章ID-模版不存在错误,那就是因为dede_arctiny表对应的dede_archives和dede_addonarticle表内容不存在

需要删除dede_arctiny表中的ID号

一般调用数据库中的内容是通过{dede:field.标签名/}来调用的

节点名称:电影天堂科幻片2
引用网址:http://www.dy2018.com/4/index.htm
匹配网站(测试用):http://www.dy2018.com/4/index_(*).html 2-2
区域开始HTML:<div class="co_content8">
区域结束HTML:</ul>

织梦采集时内容区域对空格敏感

【内容配置】
预览网址:http://www.dy2018.com/i/97869.html
匹配规则:<h1>[内容]</h1>
发布时间:<span class="updatetime">[内容]</span>

文章内容匹配规则:

<td colspan="2" align="center" valign="top"><div id="Zoom">
[内容]
              </tr>

过滤规则:[常用规则的表格过滤][脚本过滤][图像过滤][div过滤]

{dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
{dede:trim replace=""}<table([^>]*)>(.*)</table>{/dede:trim}
{dede:trim replace=""}<img([^>]*)>{/dede:trim}
{dede:trim replace=""}<div([^.]*)>{/dede:trim}
{dede:trim replace=""}</div>{/dede:trim}

自定义处理接口:

@me=str_replace('<td><span style="FONT-SIZE: 12px"><td>',’’,@me);
@me=str_replace('<div id="contentMidPicAD" style="float:right; clear:both; top:0; vertical-align:top;"><!-- 250x250启用SSP 开始 --><script type="text/javascript">var _mda_place_id ="58bcc82381892";</script><script type="text/javascript" src="http://place.ssp.desdev.cn/pageplace/show.js"></script><!-- 250x250启用SSP 结束 --></div>',’’,@me);

原文地址:https://www.cnblogs.com/wgphp/p/7765961.html