栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > PHP > php开源框架 > dedecms

织梦采集中用到的一些过滤规则

dedecms 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

织梦采集中用到的一些过滤规则

织梦dedecms的过滤规则写起来不是很难,规则如下:

代码示例:

{dede:trim}要过滤的内容{/dede:trim}

 

如果要过滤的内容很简单,完全可以把过滤规则直接写在“{dede:trim}”和“{/dede:trim}”之间。

对于比较复杂的情况,请考虑使用正则,你懂的,正则表达式,那是相当强劲的。

以下是一些过滤规则的例子,供大家参考。

1、采集中去除内容里的超链接:

代码示例:

{dede:trim}]*)>{/dede:trim}

{dede:trim}{/dede:trim}

 

假如要将所有超链接内容都去除,规则是:

代码示例:

{dede:trim}]*)>([^<]*){/dede:trim}

 

这两个规则的不同通过下面代码来解释

例如文章代码中包含着如下内容:

超链接

通过第一个规则,采集结果是:超链接

2、过滤广告

对于广告来说,过滤规则就得针对html中看到的内容使用规则了,例如某些广告仅仅是引用某个JS文件,例如

 

代码示例:

这样的规则只需

 

代码示例:

{dede:trim}{/dede:trim}

 

如果某些广告的内容是JS代码写在区间里的,例如GG的广告,那么过滤规则应该是:

 

代码示例:

{dede:trim}{/dede:trim}

3、一些测试过的过滤规则

代码示例:


{/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} // 内容来自www.dede58.com// {dede:trim}]*)>([^>]*)
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
//by www.dede58.com//
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*)
{/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim}
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/7903.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号