复制代码 代码如下:
/**
** author: site120
** function : get script part from html document
**/
var loadJs = function(str , delayTime)
{
var delayTime = delayTime || 100;
var regExp_scriptTag = new RegExp("<\\s*script([^>]*)>([\\s\\S]*?)</\\s*script\\s*>" , "gi");
var regExp_scriptAttrib_src = new RegExp("\\s*src?\\s*=\\s*(\"([^\"]+)\"|\'([^\']+)'|\\s*([^\\s]+)\\s*)" , "gi");
var arr_scriptTag = null;
var arr_scriptAttib = null;
var scriptData = "";
var jsList = new Array();
while ((arr_scriptTag=regExp_scriptTag.exec(str)) != null)
{
while ((arr_scriptAttib=regExp_scriptAttrib_src.exec(arr_scriptTag[1])) != null)
{
if (arr_scriptAttib[3])
{
jsList.push(arr_scriptAttib[3]);
}
else if (arr_scriptAttib[2])
{
jsList.push(arr_scriptAttib[2]);
}
else
{
jsList.push(arr_scriptAttib[1]);
}
}
scriptData += (arr_scriptTag[2]);
}
for (var i=0; i<jsList.length; i++)
{
var script = document.createElement("script");
script.src = jsList[i];
document.body.appendChild(script);
}
if (scriptData.length > 0)
{
var fn = "_siteFunction_" + new Date().getTime() + "_" + parseInt(Math.random()*10000) + "_120";
scriptData = " var " + fn + " = function(){ " + scriptData + " }; "+fn+"();"
window.eval(scriptData);
}
}
这是用Js来处理正则表达式,原理与Java一样,
功能是读取一段网页源代码,并将它里面所有的script标签,截取并加载运行。
这里面的[\s\S]*?利用非贪婪模式来匹配最近script标签之间的所有代码。包括换行
您可能感兴趣的文章:- 正则表达式之 贪婪与非贪婪模式详解(概述)
- 正则表达式(regex) 贪婪模式、懒惰模式使用方法
- 小议正则表达式效率 贪婪、非贪婪与回溯
- 浅谈php正则表达式中的非贪婪模式匹配的使用
- 正则表达式量词与贪婪的使用详解