正则表达式提取网址、标题、图片等一例（.Net Asp Javascript/Js）的实现-巨人网络通讯

在一些抓取、过滤等情况下，正则表达式 regular expression 的优势是很明显的。
例如，有如下的字符串：

复制代码代码如下:

li>a href="http://www.abcxyz.com/something/article/143.htm" title="FCKEditor高亮代码插件测试">span class="article-date">[09/11]/span>FCKEditor高亮代码插件测试/a>/li> 

现在，需要提取 href 后面的网址，[]内的日期，和链接的文字。
下面给出C#， ASP 和 Javascript 的实现方式
C#的实现

复制代码代码如下:

string strHTML = "li>a \"href=http://www.abcxyz.com/something/article/143.htm\" title=\"FCKEditor高亮代码插件测试\">span class=\"article-date\">[09/11]/span>FCKEditor高亮代码插件测试/a>/li>"; 
string pattern = "http://([^\\s]+)\".+?span.+?\\[(.+?)\\].+?>(.+?)"; 
Regex reg = new Regex( pattern, RegexOptions.IgnoreCase ); 
MatchCollection mc = reg.Matches( strHTML ); 
if (mc.Count > 0) 
{ 
foreach (Match m in mc) 
{ 
Console.WriteLine( m.Groups[1].Value ); 
Console.WriteLine( m.Groups[2].Value ); 
Console.WriteLine( m.Groups[3].Value ); 
} 
} 

ASP的实现

复制代码代码如下:

% 
Dim str, reg, objMatches 
str = "li>a href=""http://localhost/Z-Blog18/article/143.htm"" title=""FCKEditor高亮代码插件测试"">span class=""article-date"">[09/11]/span>FCKEditor高亮代码插件测试/a>/li>" 
Set reg = new RegExp 
reg.IgnoreCase = True 
reg.Global = True 
reg.Pattern = "http://([^\s]+)"".+?span.+?\[(.+?)\].+?>(.+?)" 
Set objMatches = reg.Execute(str) 
If objMatches.Count > 0 Then 
Response.Write("网址：") 
Response.Write(objMatches(0).SubMatches(0)) 
Response.Write("br>") 
Response.Write("日期：") 
Response.Write(objMatches(0).SubMatches(1)) 
Response.Write("br>") 
Response.Write("标题：") 
Response.Write(objMatches(0).SubMatches(2)) 
End If 
%> 

Javascript的实现

复制代码代码如下:

script type="text/javascript"> 
var str = 'li>a href="http://localhost/Z-Blog18/article/143.htm" title="FCKEditor高亮代码插件测试">span class="article-date">[09/11]/span>FCKEditor高亮代码插件测试/a>/li>'; 
var pattern = /http:\/\/([^\s]+)".+?span.+?\[(.+?)\].+?>(.+?)/gi; 
var mts = pattern.exec(str); 
if (mts != null) 
{ 
alert(mts[1]); 
alert(mts[2]); 
alert(mts[3]); 
alert(mts[4]); 
} 
/script>

您可能感兴趣的文章:

javascript 手机号码正则表达式验证函数
比较正宗的验证邮箱的正则表达式js代码详解
JS正则表达式大全(整理详细且实用)
js正则表达式的使用详解
精通JS正则表达式(推荐)
js中过滤特殊字符的正则表达式
js 正则表达式之test函数讲解
实用的JS正则表达式(手机号码/IP正则/邮编正则/电话等)
JavaScript 表单验证正则表达式大全[推荐]
JS只能输入数字或数字和字母等的正则表达式
js:日期正则表达式及检测
JS经典正则表达式笔试题汇总

全 部 栏 目

全部栏目