• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    phpQuery采集网页实现代码实例

    前言

      平时开发中可能遇到一个问题。采集网页,小偷程序等等。各种花式秀正则的话,虽然能体现出geek,但是我觉得做事却不够优雅。采集到的网页说白了也是DOM,jQuery各种优雅地获取节点。幸好,有这个类库,帮我们解决了这个,那就是phpQuery.

    为什么使用phpQuery

    phpQuery是基于php5新添加的DOMDocument。而DOMDocument则是专门用来处理html/xml。它提供了强大的xpath选择器及其他很多html/xml操作函数,使得处理html/xml起来非常方便。

    尤其对于新手,看到一堆”不知所云”的字符评凑在一起,有种脑袋都要炸了的感觉。如果要分离的对象没有太明显的特征,正则写起来更是麻烦。

    学习成本低,jQuery是PHP程序员的标配,那么懂jQuery的话,是可以无缝衔接的,学习成本几乎为0。选择器,节点,节点信息,over

    下载地址

    https://code.google.com/archive/p/phpquery/downloads(需要翻墙,或者自行百度phpQuery)

    实验

      既然开始了,那么就做个实验,比如我们要获取SF的所有标签名称https://segmentfault.com/tags,审查元素,得到部分标签属性。a class="tag" data-original-title="负载均衡">负载均衡/a>

    Demo

    ?php
      
      require("phpQuery.php");//导入phpQuery库
      $html   = phpQuery::newDocumentFile("https://segmentfault.com/tags");
      $hrefList = pq(".tag"); //获取标签为a的所有对象$(".tag")
    
      foreach ($hrefList as $href) {
        echo $href->getAttribute("data-original-title"),"br>";
      }

    结果

    总结

    0.网页采集真特么无脑暴力,成功绕过恶心的正则

    1.写法参照jQuery

    2.体会Dom的思想

    3.此类库并非万金油,更适合网页采集

    以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

    您可能感兴趣的文章:
    • php+jQuery ajax实现的实时刷新显示数据功能示例
    • jquery+ajax实现上传图片并显示上传进度功能【附php后台接收】
    • PHP结合jquery ajax实现上传多张图片,并限制图片大小操作示例
    • php使用QueryList轻松采集js动态渲染页面方法
    • PHP中使用jQuery+Ajax实现分页查询多功能操作(示例讲解)
    • 使用PHP+MySql+Ajax+jQuery实现省市区三级联动功能示例
    • php+jQuery实现的三级导航栏下拉菜单显示效果
    上一篇:通过PHP的Wrapper无缝迁移原有项目到新服务的实现方法
    下一篇:让whoops帮我们告别ThinkPHP6的异常页面
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯

    时间:9:00-21:00 (节假日不休)

    地址:江苏信息产业基地11号楼四层

    《增值电信业务经营许可证》 苏B2-20120278

    phpQuery采集网页实现代码实例 phpQuery,采集,网页,实现,