• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    正则表达式中的反向预搜索(上)
    在以前的应用,大多是应用正向预搜索情况。也就是说,在查找内容的右面有特定的内容限定,例如下面的例子:
    复制代码 代码如下:

    var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04';
    var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim;
    str3.match(reg3);
    alert(RegExp.$1); //结果是2G

    (.*(?=\;OS\:) 就是典型的正向预搜索,只有右面内容是“;OS: ”才会被匹配到。
    但是现在要实现的效果,左面的内容是固定,而不是右面。可是JavaScript并不支持反向预搜索。我相信,细心的朋友已经发现了,其实上面的例子已经达到了这个目的(前面的Memory\:\s+ 限定了左面的内容)。下面再给出一个例子:
    复制代码 代码如下:

    //程序目的,去掉图片路径中的域名
    var str = 'img src="http://news.163.com/sports/yao.jpg" >';
    var reg1 = /(\img)(.*(?=(http|https)\:\/\/))((http|https)\:\/\/[^\/]*)/gim;
    str.match(reg1);
    alert(str.replace(RegExp.$4,''));

    那么到底有没有反向预搜索呢?答案是肯定的,可是现实是残酷的。我查阅了一些资料,上面提到反向预搜索的形式是以?= 或者?! 为引导的。遗憾的是JavaScript并不支持,在高版本的Java中已获支持,于是就编写了下面的测试程序(JRE1.6.0_03):
    复制代码 代码如下:

    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    public class RegExpTest {
        public static void main(String[] args){
            Pattern p = Pattern.compile("((?=\\img.*(?=(http|https)))(http|https))");
            Matcher matcher = p.matcher("img src="http://news.163.com/sports/yao.jpg"/>");
            System.out.println(matcher.matches());
        }
    }

    程序本身应该没有什么问题,但是运行结果:

    Exception in thread "main" java.util.regex.PatternSyntaxException: Look-behind group does not have an obvious maximum length near index 27
    ((?=\img.*(?=(http|https)))(http|https))

    我Google了半天,最后得到的唯一结果就是换种写法。希望看到这篇文章的朋友,如果已经实现了这种效果,一定要留言不吝赐教。

    另外,在我看文档时看到了?:引导的正则表达式,上面说是“匹配不存储”,百思不得其解。感觉还是代码来的实在,写一个看一下:
    复制代码 代码如下:

    var str2 = '客户端名称';
    var reg2 = /(客户端名(?:称)?)/;
    str2.match(reg2);
    alert(RegExp.$1); //客户端名称
    alert(RegExp.$2); //空字符串
    //不使用?:
    reg2 = /(客户端名(称)?)/;
    str2.match(reg2);
    alert(RegExp.$1); //客户端名称
    alert(RegExp.$2); //称

    敏捷开发思想说:代码是最好的文档。给了我借口,呵呵。
    上一篇:ASP 正则表达式常用的几种方法(execute、test、replace)
    下一篇:c# 正则表达式对网页进行有效内容抽取
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯

    时间:9:00-21:00 (节假日不休)

    地址:江苏信息产业基地11号楼四层

    《增值电信业务经营许可证》 苏B2-20120278

    正则表达式中的反向预搜索(上) 正则,表达式,中的,反向,