最新活动:电脑PC端+手机端+微网站+自适应网页多模板选择-建站388元起价!!!
当前位置:主页 > 网站建设 > 织梦dedecms采集中用到的一些过滤规则,DEDE技术

织梦dedecms采集中用到的一些过滤规则,DEDE技术

时间:2023-07-19 09:07:19 阅读: 文章分类: 网站建设 作者: 织梦编辑员

导读:DEDE技术DEDE技术为大家介绍一些在织梦dedecms采集文章时用到的一些过滤规则,内容很不错,有需要的朋友,可以参考下。织梦模板免费下裁织梦的模板。

织梦模板免费下裁织梦的模板

dedecms的过滤规则写起来不是很难,规则如下:  

代码示例: {dede:trim}要过滤的内容{/dede:trim}

如果要过滤的内容很简单,完全可以把过滤规则直接写在“{dede:trim}”和“{/dede:trim}”之间。 对于比较复杂的情况,请考虑使用正则,你懂的,正则表达式,那是相当强劲的。

以下是一些过滤规则的例子,供大家参考。

1、采集中去除内容里的超链接:  

代码示例: {dede:trim}<a([^>]*)>{/dede:trim} {dede:trim}</a>{/dede:trim}

假如要将所有超链接内容都去除,规则是:  

代码示例: {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

这两个规则的不同通过下面代码来解释 例如文章代码中包含着如下内容: <a href="#">超链接</a> 通过第一个规则,采集结果是:超链接

2、过滤广告 对于广告来说,过滤规则就得针对html中看到的内容使用规则了,例如某些广告仅仅是引用某个JS文件,例如  

代码示例: <script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>

这样的规则只需  

代码示例: {dede:trim}<script(.*)>{/dede:trim} {dede:trim}</script>{/dede:trim}

如果某些广告的内容是JS代码写在<script></script>区间里的,例如GG的广告,那么过滤规则应该是:  

代码示例: {dede:trim}<script>(.*)</script>{/dede:trim}

3、一些测试过的过滤规则  

代码示例:

{dede:trim}<!–(.*)–>{/dede:trim} {dede:trim}<select([^&dede手机模板gt;]*)>([^>]*)</select>{/dede:trim} {dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim} {dede:trim}<select([^>]*)>{/dede:trim} {dede:trim}</select>{/dede:trim} {dede:trim}<param([^>]*)>{/dede:trim} {dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim} {dede:trim}<embed([^>]*)>{/dede:trim} {dede:trim}</embed>{/dede:trim} {dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim} {dede:trim}<object([^>]*)>{/dede:trim} {dede:trim}</object>{/dede:trim} {dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim} {dede:trim}<OBJECT([^>]*)>{/dede:trim} {dede:trim}</OBJECT>{/dede:trim} {dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim} {dede:trim}<iframe([^>]*)>{/dede:trim}

//by www.jbxue.com// {dede:trim}</iframe>{/dede:trim} {dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim} {dede:trim}<IFRAME([^>]*)>{/dede:trim} {dede:trim}</IFRAME>{/dede:trim} {dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim} {dede:trim}<font([^>]*)>{/dede:trim} {dede:trim}</font>{/dede:trim} {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim} {dede:trim}<a([^>]*)>{/dede:trim} {dede:trim}</a>{/dede:trim} {dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim} {dede:trim}<td([^>]*)>{/dede:trim} {dede:trim}</td>{/dede:trim} {dede:trim}<tr([^>]*)>([^>]*)</tr&g织梦文章模板t;{/dede:trim} {dede:trim}<tr([^>]*)>{/dede:trim} {dede:trim}</tr>{/dede:trim} {dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim} {dede:trim}<tbody>{/dede:trim} {dede:trim}</tbody>{/dede:trim} // 内容来自www.jbxue.com// {dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim} {dede:trim}<table([^>]*)>{/dede:trim} {dede:trim}</table>{/dede:trim} {dede:trim}<span([^>]*)>{/dede:trim} {dede:trim}</span>{/dede:trim} {dede:trim}</IFRAME>{/dede:trim} {dede:trim}<script>(.*)</script>{/dede:trim} {dede:trim}<script(.*)>{/dede:trim} {dede:trim}</script>{/dede:trim} // 本文

关键词标签: 织梦 标签 规则

声明: 本文由我的SEOUC技术文章主页发布于:2023-07-19 ,文章织梦dedecms采集中用到的一些过滤规则,DEDE技术主要讲述规则,标签,织梦网站建设源码以及服务器配置搭建相关技术文章。转载请保留链接: https://www.seouc.com/article/web_30152.html

我的IDC 网站建设技术SEOUC.COM
专注网站建设,SEO优化,小程序设计制作搭建开发定制网站等,数千家网站定制开发案例,网站推广技术服务。
  • 5000+合作客服
  • 8年从业经验
  • 150+覆盖行业
  • 最新热门源码技术文章