帝国cms分页采集正则及过滤技巧建站知识
导读:1建站知识帝国CMS模板网下面的帝国CMS教程栏目为您提供了帝国cms分页采集正则及过滤技巧网站建设教程建设网站公司。
老实说我并不主张网站采集,不过做为站长,网页采集实在是一大利器。拿帝国CMS来说,采集功能很强大。虽然帝国CMS采集方法简单易学,但还是有朋友为采集规则而绞尽脑汁。以下是我悼念的一些帝国CMS的采集正则。
从文章的源代码中获得的
第一种:
<p align='center'><b><font color='red'>[1]</font> <a href='/Eat/RMenu/200806/38611_2.html'>[2]</a> <a href='/Eat/RMenu/200806/38611_3.html'>[3]</a> <a href='/seo网站优化软件Eat/RMenu/200806/38611_4.html'>[4]</a> <a href='/Eat/RMenu/200seo网站优化806/38611_2.html'>下一页</a> </b></p>
编写的规则:
选全部列出式 区域正则: <p align='center'><b><font color='red'>[!--smallpageallzz--]'>下一页 链接正则: <a href='[!--pageallzz--]'>
--------------------------------------------------------------------------------
第二种
采集代码
<p align='center'><b><font color='red'>[1]</font> <a href='/lw/3/lw_31205_2.html'>[2]</a> <a href='/lw/3/lw_31205_2.html'>下一页</a> </b></p> <center>《
编写的规则:
选用上下导航式: 分页区域正则:<font color='red'>[!--smallpagezz--]下一页 分页链接正则:<a href='[!--pagezz--]' 新闻正文正则: src="http://pagead2.googlesyndication.com/pagead/show_ads.js"> </script></td> </tr> </table>[!--newstext--]</td> </tr> <tr> <td width=5></td>
过滤广告正则: </p> <center>[!--ad--]</center>,</p><p align='center'>[!--ad--]</b>
例如:http://www.3edu.net/lw/3/lw_31205.html
--------------------------------------------------------------------------------
第三种
<p align="center"><img src="/bgy/Images_1/sy8.gif" border="0" align="absbottom"> <FONT style="COLOR: #ff0000">【1】</font> <a class=page href="094221656-2.html" target=_self>【2】</a> <a class=page href="094221656-3.html" target=_self>【3】</a> <a class=page href="094221656-4.html" target=_self>【4】</a> <a class=page href="094221656-5.html" target=_self>【5】</a> <a href="094221656-2.html"><img src="/gwy/Images1/xy.gif" border="0" align="absbottom"></a></p>
编写的规则:
"全部列出"式正则设置:
分页区域正则(无) 分页链接正则: <a class=page href="[!--pageallzz--]" target=_self>
声明: 本文由我的SEOUC技术文章主页发布于:2023-05-22 ,文章帝国cms分页采集正则及过滤技巧建站知识主要讲述帝国,正则,帝国cms分页采集正则及过滤技巧建站知网站建设源码以及服务器配置搭建相关技术文章。转载请保留链接: https://www.seouc.com/article/web_4779.html