• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    正则表达式学习教程之回溯引用backreference详解

    本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考,具体如下:

    在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。

    一、问题引入

    一个在HTML页面中匹配标题标签(H1—H6)的问题:

    文本:

    body>
    h1>Welcome to my page/H1>
    Content is divided into twosections:br>
    h2>Introduction/h2>
    Information about me.
    H2>Hobby/H2>
    Information about my hobby.
    h2>This is invalid HTML/h3>
    /body>
    
    

    正则表达式:[hH][1-6]>.*?/[hH][1-6]>

    结果:

    body>
    【h1>Welcome to my page/H1>】
    Content is divided into twosections:br>
    【h2>Introduction/h2>】
    Information about me.
    【H2>Hobby/H2>】
    Information about my hobby.
    【h2>This is invalid HTML/h3>】
    /body>

    分析:模式[hH][1-6]>匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了h1>、h2>,/[hH][1-6]>匹配到了/h1>、/h2>、/h3>;这里使用了懒惰型元字符来匹配标签中的文本,否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出,有一个无效的标签也匹配上了,即h2>/h3>,它们根本不能配对。要解决这个问题,就需要使用到回溯引用(backreference)。

    二、回溯引用匹配

    回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:

    文本:

    body>
    h1>Welcome to my page/H1>
    Content is divided into twosections:br>
    h2>Introduction/h2>
    Information about me.
    H2>Hobby/H2>
    Information about my hobby.
    h2>This is invalid HTML/h3>
    /body>
    
    

    正则表达式:[hH]([1-6])>.*?/[hH]\1>

    结果:

    body>
    【h1>Welcome to my page/H1>】
    Content is divided into twosections:br>
    【h2>Introduction/h2>】
    Information about me.
    【H2>Hobby/H2>】
    Information about my hobby.
    h2>This is invalid HTML/h3>

    分析:首先匹配开始标题标签的模式[hH]([1-6])>,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为/[hH]\1>,其中\1表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那\1也匹配到1,如果匹配到2,那\1也匹配到2,所以最后一个无效的标题标签就不会被匹配到了。

    PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

    JavaScript正则表达式在线测试工具:
    http://tools.jb51.net/regex/javascript

    正则表达式在线生成工具:
    http://tools.jb51.net/regex/create_reg

    更多关于JavaScript相关内容感兴趣的读者可查看本站专题:《JavaScript正则表达式技巧大全》、《JavaScript替换操作技巧总结》、《JavaScript查找算法技巧总结》、《JavaScript数据结构与算法技巧总结》、《JavaScript遍历算法与技巧总结》、《JavaScript中json操作技巧总结》、《JavaScript错误与调试技巧总结》及《JavaScript数学运算用法总结》

    希望本文所述对大家JavaScript程序设计有所帮助。

    您可能感兴趣的文章:
    • Python正则表达式分组概念与用法详解
    • 正则表达式分组实例详解
    • javascript正则表达式中分组详解
    • 正则表达式、分组、子匹配(子模式)、非捕获子匹配(子模式)
    • 正则表达式之分组的回溯引用问题
    上一篇:JS基础教程——正则表达式示例(推荐)
    下一篇:正则表达式教程之操作符及说明详解
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯

    时间:9:00-21:00 (节假日不休)

    地址:江苏信息产业基地11号楼四层

    《增值电信业务经营许可证》 苏B2-20120278

    正则表达式学习教程之回溯引用backreference详解 正则,表达式,学习教程,