• 全国400电话网上服务平台
    强大号码库资源任选,方便,快捷,快速开通。
    咨询热线:400-1100-266  

    织梦dedecms采集过滤万能代码
    POST TIME:2020-04-02 14:02

    一:过滤标题中空格

    经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤。

    {dede:trim} {/dede:trim}

    二:过滤来源作者中连接

    在采集文章的时候,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤

    {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

    三:过滤文章内容中连接以及其他广告代码

    实际应用中,我们只需要对连接、动画、调用等进行过滤。

    一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:

    {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
    {dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
    {dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
    {dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

    四:过滤GG广告代码

    其实这个就是在上面的内容过滤,因为很常用到所以单独作为一个应用列出来:

    {dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

    最后终结一下,掌握了下面这个

    {dede:trim}
    {/dede:trim}
    {dede:trim}<param([^>]*)>{/dede:trim}
    {dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
    {dede:trim}<embed([^>]*)>{/dede:trim}
    {dede:trim}</embed>{/dede:trim}
    {dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
    {dede:trim}<object([^>]*)>{/dede:trim}
    {dede:trim}</object>{/dede:trim}
    {dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
    {dede:trim}<OBJECT([^>]*)>{/dede:trim}
    {dede:trim}</OBJECT>{/dede:trim}
    {dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
    {dede:trim}<iframe([^>]*)>{/dede:trim}
    {dede:trim}</iframe>{/dede:trim}
    {dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
    {dede:trim}<IFRAME([^>]*)>{/dede:trim}
    {dede:trim}</IFRAME>{/dede:trim}
    {dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
    {dede:trim}<font([^>]*)>{/dede:trim}
    {dede:trim}</font>{/dede:trim}
    {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
    {dede:trim}<a([^>]*)>{/dede:trim}
    {dede:trim}</a>{/dede:trim}
    {dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
    {dede:trim}<td([^>]*)>{/dede:trim}
    {dede:trim}</td>{/dede:trim}
    {dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
    {dede:trim}<tr([^>]*)>{/dede:trim}
    {dede:trim}</tr>{/dede:trim}
    {dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
    {dede:trim}<tbody>{/dede:trim}
    {dede:trim}</tbody>{/dede:trim}
    {dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
    {dede:trim}<table([^>]*)>{/dede:trim}
    {dede:trim}</table>{/dede:trim}
    {dede:trim}<img([^>]*)>{/dede:trim}
    {dede:trim}<span([^>]*)>{/dede:trim}
    {dede:trim}</span>{/dede:trim}
    {dede:trim} {/dede:trim}
    {dede:trim}<stong>{/dede:trim}
    {dede:trim}</stong>{/dede:trim}

     

    
    关于我们 | 付款方式 | 建站知识 | 增值服务 | 网站模板
    Copyright © 2003-2016
    时间:9:00-21:00 (节假日不休)
    版权所有:巨人网络(扬州)科技有限公司
    总部地址:江苏省信息产业基地11号楼四层
    《增值电信业务经营许可证》 苏B2-20120278
    X

    截屏,微信识别二维码

    微信号:veteran88

    (点击微信号复制,添加好友)

     打开微信

    微信号已复制,请打开微信添加咨询详情!