• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    正则表达式提取网址、标题、图片等一例(.Net Asp Javascript/Js)的实现
    在一些抓取、过滤等情况下, 正则表达式 regular expression 的优势是很明显的。
    例如,有如下的字符串:
    复制代码 代码如下:

    li>a href="http://www.abcxyz.com/something/article/143.htm" title="FCKEditor高亮代码插件测试">span class="article-date">[09/11]/span>FCKEditor高亮代码插件测试/a>/li>

    现在,需要提取 href 后面的网址,[]内的日期,和 链接的文字。
    下面给出C#, ASP 和 Javascript 的实现方式
    C#的实现
    复制代码 代码如下:

    string strHTML = "li>a \"href=http://www.abcxyz.com/something/article/143.htm\" title=\"FCKEditor高亮代码插件测试\">span class=\"article-date\">[09/11]/span>FCKEditor高亮代码插件测试/a>/li>";
    string pattern = "http://([^\\s]+)\".+?span.+?\\[(.+?)\\].+?>(.+?)";
    Regex reg = new Regex( pattern, RegexOptions.IgnoreCase );
    MatchCollection mc = reg.Matches( strHTML );
    if (mc.Count > 0)
    {
    foreach (Match m in mc)
    {
    Console.WriteLine( m.Groups[1].Value );
    Console.WriteLine( m.Groups[2].Value );
    Console.WriteLine( m.Groups[3].Value );
    }
    }

    ASP的实现
    复制代码 代码如下:

    %
    Dim str, reg, objMatches
    str = "li>a href=""http://localhost/Z-Blog18/article/143.htm"" title=""FCKEditor高亮代码插件测试"">span class=""article-date"">[09/11]/span>FCKEditor高亮代码插件测试/a>/li>"
    Set reg = new RegExp
    reg.IgnoreCase = True
    reg.Global = True
    reg.Pattern = "http://([^\s]+)"".+?span.+?\[(.+?)\].+?>(.+?)"
    Set objMatches = reg.Execute(str)
    If objMatches.Count > 0 Then
    Response.Write("网址:")
    Response.Write(objMatches(0).SubMatches(0))
    Response.Write("br>")
    Response.Write("日期:")
    Response.Write(objMatches(0).SubMatches(1))
    Response.Write("br>")
    Response.Write("标题:")
    Response.Write(objMatches(0).SubMatches(2))
    End If
    %>

    Javascript的实现
    复制代码 代码如下:

    script type="text/javascript">
    var str = 'li>a href="http://localhost/Z-Blog18/article/143.htm" title="FCKEditor高亮代码插件测试">span class="article-date">[09/11]/span>FCKEditor高亮代码插件测试/a>/li>';
    var pattern = /http:\/\/([^\s]+)".+?span.+?\[(.+?)\].+?>(.+?)/gi;
    var mts = pattern.exec(str);
    if (mts != null)
    {
    alert(mts[1]);
    alert(mts[2]);
    alert(mts[3]);
    alert(mts[4]);
    }
    /script>
    您可能感兴趣的文章:
    • javascript 手机号码正则表达式验证函数
    • 比较正宗的验证邮箱的正则表达式js代码详解
    • JS正则表达式大全(整理详细且实用)
    • js正则表达式的使用详解
    • 精通JS正则表达式(推荐)
    • js中过滤特殊字符的正则表达式
    • js 正则表达式之test函数讲解
    • 实用的JS正则表达式(手机号码/IP正则/邮编正则/电话等)
    • JavaScript 表单验证正则表达式大全[推荐]
    • JS只能输入数字或数字和字母等的正则表达式
    • js:日期正则表达式及检测
    • JS经典正则表达式笔试题汇总
    上一篇:正则表达式在线测试工具
    下一篇:asp.net 正则表达式[经常用的到]
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯

    时间:9:00-21:00 (节假日不休)

    地址:江苏信息产业基地11号楼四层

    《增值电信业务经营许可证》 苏B2-20120278

    正则表达式提取网址、标题、图片等一例(.Net Asp Javascript/Js)的实现 正则,表达式,提取,网址,