栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > PHP > php开源框架 > dedecms

织梦dedecms采集中用到的一些过滤规则

dedecms 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

织梦dedecms采集中用到的一些过滤规则

织梦dedecms的过滤规则写起来不是很难,规则如下:   代码示例: {dede:trim}要过滤的内容{/dede:trim}   如果要过滤的内容很简单,完全可以把过滤规则直接写在“{dede:trim}”和“{/dede:trim}”之间。 对于比较复杂的情况,请考虑使用正则,你懂的,正则表达式,那是相当强劲的。 以下是一些过滤规则的例子,供大家参考。 1、采集中去除内容里的超链接:   代码示例: {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim}   假如要将所有超链接内容都去除,规则是:   代码示例: {dede:trim}]*)>([^<]*){/dede:trim}   这两个规则的不同通过下面代码来解释 例如文章代码中包含着如下内容: 超链接 通过第一个规则,采集结果是:超链接 2、过滤广告 对于广告来说,过滤规则就得针对html中看到的内容使用规则了,例如某些广告仅仅是引用某个JS文件,例如   代码示例:   这样的规则只需   代码示例: {dede:trim}{/dede:trim}   如果某些广告的内容是JS代码写在区间里的,例如GG的广告,那么过滤规则应该是:   代码示例: {dede:trim}{/dede:trim} 3、一些测试过的过滤规则   代码示例: {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} //by www.jbxue.com// {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^<]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^<]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} // 内容来自www.jbxue.com// {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim}
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/5235.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号