• 企业400电话
  • 网络优化推广
  • AI电话机器人
  • 呼叫中心
  • 全 部 栏 目

    网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    php使用自带dom扩展进行元素匹配的原理解析
    POST TIME:2021-10-18 03:43

    DOMDocument

    php提供了非常好用的解析html和xml文档的扩展库DOM,使用这个库可以非常高效的进行html和xml文档的解析,它的原理就是通过寻找首尾匹配对来进行文档的解析。

    从上面的分析可以看出,如果首位不匹配,可能就会导致一些错误的出现,因此,这个时候我们需要设置

    libxml_use_internal_errors(true);

    来进行错误的屏蔽,让它可以解析整个文档。

    解析html基本用法

    $dom = new \DOMDocument;
    $content = htmlspecialchars_decode($content);
    libxml_use_internal_errors(true);
    $content = mb_convert_encoding($content, 'HTML-ENTITIES', 'UTF-8');
    $dom->loadHTML($content);

    $content是要解析的html字符串,其中我们对它进行了转义,因为可能含有实体集,然后我们有进行了编码的转换,因为可能文档不是utf-8格式的,会导致日文,法文等文字乱码。

    获取元素

    $a = $dom->getElementsByTagName('a');
    $p = $dom->getElementsByTagName('p');

    遍历元素

    $elements = $dom->getElementsByTagName('a');
    foreach ($elements as $element) {
      $element->textContent = '替换成其它的文字';
    }

    通过上面的循环,可以将全部a标签的文字替换掉。

    元素嵌套

    有些时候,html会嵌套很多层,比如

    div>
    p>
    a href="xxx" rel="external nofollow" >我是文字/a>
    /p>
    p>
    内容替换
    /p>
    /div>

    如果我们想要对p标签文字进行替换的化,并且不想要替换含有子元素的内容,就是这里的a标签不想替换,下面的语句不能够解决我们的问题:

    $elements = $dom->getElementsByTagName('p');
    foreach ($elements as $element) {
      if($element->hasChildNodes()){
        $element->textContent = 'p标签内容替换';
      }
    }

    上面的代会将a标签的内容也替换掉,这不是我们想要的结果,因为hasChildNodes()这个函数表示的含有内容,无论它是标签还是文字,它都是返回true的,除非它是空标签,例如

    它才会返回false.

    所以我们需要自己封装一个函数进行检查是否含有嵌套标签。

    function hasChild($element, $tags)
    {
      foreach($tags as $v){
      $elements = $element->getElementsByTagName($v);
    
      if($elements->length){
      return true;
      }
    
      }
      return false;
    }
    $tags = array('title','h1','h2','h3','h4','h5','a','p','dd','img');  
    
    $elements = $dom->getElementsByTagName('p');
    foreach ($elements as $element) {
      if(hasChild($element, $tags)){
        $element->textContent = 'p标签内容替换';
      }
    }

    通过我们自己封装的函数,就可以判断出$dom的node节点是否含有子标签。

    总结

    到此这篇关于php使用自带dom扩展进行元素匹配的文章就介绍到这了,更多相关php元素匹配内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

    您可能感兴趣的文章:
    • PHP代码加密和扩展解密实战
    • Thinkphp使用Zxing扩展库解析二维码内容图文讲解
    • PHP安装扩展mcrypt以及相关依赖项深入讲解
    • win10下 php安装seaslog扩展的详细步骤
    • PHP扩展安装方法步骤解析
    • php使用event扩展的io复用测试的示例
    • 安装PHP扩展时解压官方 tgz 文件后没有configure文件无法进行配置编译的问题
    • PHP 扩展Memcached命令用法实例总结
    • Thinkphp 框架配置操作之动态配置、扩展配置及批量配置实例分析
    • docker 安装 php-fpm 服务 / 扩展 / 配置的示例教程详解
    • 如何动态查看及加载PHP扩展
    上一篇:PHP实现本地图片转base64格式并上传
    下一篇:PHP实现图片防盗链破解操作示例【解决图片防盗链问题/反向代理】
  • 相关文章
  • 

    关于我们 | 付款方式 | 荣誉资质 | 业务提交 | 代理合作


    © 2016-2020 巨人网络通讯

    时间:9:00-21:00 (节假日不休)

    地址:江苏信息产业基地11号楼四层

    《增值电信业务经营许可证》 苏B2-20120278

    X

    截屏,微信识别二维码

    微信号:veteran88

    (点击微信号复制,添加好友)

     打开微信