浅析网站垃圾内容的识别以及处理方法
如何识别网站垃圾内容
观点一:抄袭的文章就是垃圾内容
还是拿最大牌的搜索引擎百度来说吧,2013着实是一个与众不同的年份,无论是绿萝,还是石榴,都让很多站长的排名深受影响,绿萝算法说白了就是针对链接作弊,当然,这其中肯定会有些是属于误伤,除此之外,在去年年底的时候,百度还推出了了一个所谓的星火计划,主要就是支持原创性站点,这样一来,不少朋友,都会不由自主的觉得,抄袭的内容就是垃圾内容。
观点二:浏览时间短的文章是垃圾内容
第一种是表面的判断,是否是抄袭,只要搜索一下,立马就能判断,第二种观点,是看页面的访问时间,有的朋友觉得,对于网友有价值的内容,网友就会停留更长的时间,所以,浏览时间短的内容,肯定就是垃圾内容。
关于上面所提及到的低一点和第二点,我并不完全赞同,首先说,自从搜索引擎推出了“支持原创”的说法之后,有多少人开始进行所谓的“原创”工作?不得不说,对于很多人来讲,“原创”和“伪原创”已经混淆,甚至有人说高质量的伪原创就是原创!或许从字面上来看,颠倒且替换之后的语言的确不同,但是对于网友来说,看到的是一篇基本无价值的“废话”。而且有的时候,网站编辑对于一些不甚熟悉的名字,还会自作主张的替换或者更改,甚至为了凑字数而减少一部分文章,这样让人读起来更加的晦涩难懂,甚至会将网友引导到一条错误的道路上,如此一来,原创还不如直接抄袭更对读者有价值。
第二种观点,相对比与第一种,的确有了层面上的提升,不再从表面看事情,能够深入一些,不过我还是觉得不过全面,为什么这么说呢?比如说想要寻找某个汉字怎么读,或者想知道列车到站时间,我只要搜索一下,答案尽在眼前,我找到了我需要的答案,难道好要在留下来?难道有一大堆文字,我找半天才找到启动时间的页面会比一个直接展示出时间的页面更利用用户体验?
显然,抄袭的内容不能够说是垃圾内容,浏览时间长的内容也不能说是有价值内容。那么,如何找到网站的垃圾内容呢?
小编以为,访问次数是判断垃圾内容的最关键因素。
我们的网站肯定都会有数据统计软件,使用这些软件,我们就能够很好的识别出,那些链接点击比较多,点击率高的,就是用户关心的内容,点击率少的,说句难听的,就是站着茅坑不拉屎,白白浪费网站权重,但是却没有对用户产生价值。
我之前的一个博客,为了坚持“每天一篇”的原则,不顾用户体验,不在乎这篇文章是否会对用户有价值,都会坚持每天一篇,今天回过头来想一下,真的是很幼稚,这些没有人看的文章,说白了就是垃圾内容,发布到网站上面,不但不会有好的作用,还会有负面影响,分散权重。现在,笔者的网站,无论是文章、分类、边侧,都尽量的精简,不多说一句话,在首页上不多放一个链接,这样做的目的,就是尽量减少垃圾内容,各位是不是也要检查一下自己的网站?
是不是有一些分类设置之后,文章很小,甚至根本就没有文章?
是不是有些分类能够合并在一起?
是不是边侧栏的一些栏目根本无用?比如日历?登陆登出?
是不是页脚导航无人点击?
是不是吧面包屑导航的“首页”肆无忌惮的更换成了某一个你认为重要的锚文本关键词?
是不是在footer中还存在以锚文本形式的版权链接?
是不是……?
从细节上改变,seo不仅仅只有外链哦!
如何处理网站垃圾内容
当我们找到网站中存在的垃圾内容之后,又应该如何处理呢?像我的博客是新站,所以,从一开始设置要再开放robots即可,但是有些朋友的网站已经运营一段时间了,又应该何去何从呢?
我个人觉得,有以下几个处理方式:
第一步,删除网站中的垃圾内容(前提是你已经找到垃圾内容)
第二步,在robots.txt中添加“Disallow: /”遇见,把所有相关的删除的页面全部Disallow: /掉,具体写法可以去查看robots.txt写法。
第三步,在各大搜索引擎所对应的站长工具中从新提交
值得说明的一个问题,是,不少朋友都觉得好不容易写的文章,就这样删除了?怪可惜的,好吧,您可以考虑下,是继续被降权,还是壮士断腕,孔子曰,舍不得孩子套不住狼,你懂得!