Google蜘蛛爬虫可以运行网页中的JS脚本和CSS样式-巨人网络通讯

企业400电话

微网小程序

AI电话机器人

电商代运营

全部栏目

企业400电话网络优化推广 AI电话机器人呼叫中心网站建设商标✡知产微网小程序电商运营彩铃•短信增值拓展业务

Google蜘蛛爬虫可以运行网页中的JS脚本和CSS样式

旧观念

在我的既有观念中，搜索引擎的网页爬虫/蜘蛛/机器人（Crawler/Spider/Robot）只抓取页面的 HTML 代码，对于内部或外部的 JS 与 CSS 代码是一律无视的。所以我们也经常会说，Ajax 不利于搜索引擎的抓取，不利于 SEO。

因为在我们看来，搜索引擎爬虫毕竟不是功能强大的浏览器，它无法运行 JS，也无法渲染 CSS。那些五彩缤纷的页面，在爬虫眼中不过是纯粹的文本流（或包含了结构标记的文本信息流）而已。

然而，近期看到的两则关于 Google 的新闻，彻底颠覆了我对搜索引擎爬虫的认知。

新闻一

一段来自 Google 资深工程师 Matt Cutts 的视频震惊了我。Matt 告诫我们，不仅文本与背景同色、字体大小设置为 0、用 CSS 隐藏文字等等这些伎俩已经是小儿科了，而且 Google 现在还可以识别通过 JS 来隐藏文字的作弊方法。

在视频中，一段隐晦的 JS 代码将某元素的 .style.display 属性设置为 'none'，试图隐藏那些只打算提供给搜索引擎、而不展示给用户的文字。Matt 表示，这种作弊方式现在已经瞒不了 Google 了。

新闻二

新闻二更加恐怖，据说 Google 可以抓取 Ajax 内容！该文表示，给 URL 的 hash 部分加上特定的标识符（即 domain.com/#abc 改为 domain.com/#!abc），会让 Googlebot 领悟到该 URL 是一个 Ajax 页面（而非页面中的锚点），并进行抓取。

你可能对 Google 的这一技术改进没多少兴趣，但你肯定注意到了问题的本质：Googlebot 可以抓取 Ajax 内容，也就是说，Googlebot 完全有能力运行页面中的 JS，而且功能完善！

爬虫与浏览器

如果这两则新闻都是真的，那么，从某种意义上说，爬虫的行为和能力已经与浏览器越来越接近了。这也意味着，搜索引擎爬虫将抓取更多的内容（包括 JS 和 CSS 文件），网站的流量负载将会加大。

另一方面，爬虫在抓取页面的过程中也将产生更多的资源消耗——毕意仅仅处理文本信息的资源开销要远远小于完整地渲染页面和运行客户端程序。

因此，我目前仍然对这两则新闻半信半疑。难道这是 Google 放出的烟幕弹？或者是好事者炮制的假新闻？如果 Googlebot 真的已经具备了运行 JS 或渲染 CSS 的能力，那么为了将资源开销控制在合理的范围内，或许 Google 会在内部启用黑/白名单机制？

站长们

如果担心爬虫对主机流量的侵蚀，或许可以考虑在 robots.txt 文件中禁止爬虫对 *.js 和 *.css 文件的抓取。不过暂不确定这样做是否存在不良的副作用。

或许也有人会担心，正常的页面布局有时候也需要使用一些隐藏文字的手段，比如【CSS 图代文】、【隐藏模块的 hx 标识信息】等等。这样会不会被 Google 判定为作弊呢？

我相信对于像 Google 这样“聪明”的搜索引擎来说，它即然有能力让爬虫运行 JS 和 CSS，它也必然有能力来判断什么是作弊、什么是正常的布局需要。所以我觉得站长们大可不必惊慌，平常该怎样就怎样，身正不怕影斜，规则总是用来约束那些“不法之徒”的。

所以，对于某些 SEOer 来说，这似乎是个坏消息。如果他们还在考虑是否还有新的作弊方案，那么我觉得意义不大。很显然，SEO 作弊手段的生存空间将越来越小，与此同时，网站自身内容的价值才是 SEO 的真实基础。

上一篇：众麦通信将出席2017中国互联网保险发展论坛
下一篇：广泽国际发展将终止全国经营呼叫中心业务

相关文章

Google蜘蛛爬虫可以运行网页中的JS脚本和CSS样式

旧观念在我的既有观念中，搜索引擎的网页爬虫/蜘蛛/机器人（Crawler/Spider/Robot）只抓取页面的 HTML 代码，对于内部或外部的 JS 与 CSS 代码是一律无视的。所以我们也经常会说，Ajax 不利Google,蜘蛛,爬虫,可以,运行,...

外呼电话短信系统（外呼电话app）

本篇文章给大家谈谈外呼电话短信系统，以及外呼电话app对应的知识点，希望对各位有...

智能商务电子名片

微信小程序的出现让许多APP都减少了许多，不只能够腾出手机空间，也让家政公司在运...

取得硬盘数.bat

@echooff cd.script.txt script.txtecholistdisk for/f%%iin('diskpart/sscript.txt^|find/c^"联机^"')doSetHardDriv...

包头市稳定高频外呼卡办理

移动合作虚拟运营商受益明显先前，移动只有3000万码号资源供合作虚拟运营商使用，分...

大唐融合：贵阳市渐成呼叫中心产业发展“宝地”

近日，从贵阳市服务外包办获悉，2017年上半年，贵阳新增签约落地服务外包及呼叫中心...

山西盛视广告建设呼叫中心系统

近日，强讯呼叫中心系统在山西盛视广告有限公司正式上线。项目背景运城市盛视广...

牛奶商标转让有哪些流程？

牛奶相信大家都喝过吧，老少皆宜，是最古老的天然饮料之一，被誉为白色血液。牛奶...

阿里巴巴马云给一只远在非洲的大象命名为“杭州”

站长之家（Chinaz.com）7月24日消息：近日，马云首次到访非洲，而且上了非洲电视、报...

长沙服务外包首个产学研校企合作联盟成立

本报讯（记者岳霞通讯员何重兴）呼叫中心外包是长沙市服务外包发展的重要产业，...

潮州市电话机器人维修点（潮州市家电维修）

本文目录一览：1、戴森售后维修点2、1周林频普潮州维修点地址3、驰力源早教机器人售...

flv播放器在网页中播放flv

复制代码代码如下: objectclassid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download...

洛阳智能外呼系统公司电话的简单介绍

本篇文章给大家谈谈洛阳智能外呼系统公司电话，以及对应的知识点，希望对各位有所...

宏财网募集期疯狂贴息人性化办事让“钱不闲”

目前，网贷平台整改的最后期限即将到来，成功迈入合规线内的宏财网即将开始合规运...

陕西电话外呼系统供应商（西安外呼公司）

今天给各位分享陕西电话外呼系统供应商的知识，其中也会对西安外呼公司进行解释，...

400开头的电话怎么办理400开头的电话哪的

(400开头的电话怎么办理)(400开头的电话哪的)以下内容由巨人小编整理发布。需要强调...

Google蜘蛛爬虫可以运行网页中的JS脚本和CSS样式

旧观念在我的既有观念中，搜索引擎的网页爬虫/蜘蛛/机器人（Crawler/Spider/Robot）只抓取页面的 HTML 代码，对于内部或外部的 JS 与 CSS 代码是一律无视的。所以我们也经常会说，Ajax 不利Google,蜘蛛,爬虫,可以,运行,...

© 2016-2020 巨人网络通讯版权所有

《增值电信业务经营许可证》苏ICP备15040257号-8

Google蜘蛛爬虫可以运行网页中的JS脚本和CSS样式 Google,蜘蛛,爬虫,可以,运行,