如何才能让自己发布的信息最快出现在百度首页?
其实,搜索引擎对结果的呈现,是由一系列复杂的算法、排序规则决定,并不是简单由“新发布的内容”决定。
我们先了解下百度搜索首页的结果通常是由什么信息组成的:
1、 百度付费广告(竞价排名推广/展示广告)
2、 百度免费产品:百科、资讯流(原百度新闻)、熊掌号、百家号、知道、贴吧、百库、地图、图片、视频、音乐、电商聚合等
3、 机构/企业官网
4、 新闻网站发布的新闻资讯
5、 社交网站的UGC内容,包括微博、问答类网站(知乎)、论坛、博客、视频网站等
6、 招聘信息网站
7、 分类信息网站
8、 电商购物网站(包括OTA在线旅行预订)
9、 股市行情(上市公司)
10、 其它相关网页信息
PC和移动端搜索除了设备和展示形式上的不同之外,前几种类型的内容会依次占据PC+移动首页搜索结果,排序不会有太多本质差别。除了百度付费广告和其产品外,自然搜索结果的排序主要由以下方面因素影响:
用户相关度
搜索引擎首先需要确保呈现结果与用户的搜索需求紧密相关,这里的相关度包括关键词在网页中出现的位置、频次(密度)。
对于构成绝大多数自然搜索结果的资讯内容来说,关键词在正副标题、首段、正文中出现的位置、频次(合理的),对搜索引擎的相关度评判会有直接影响。在百度早期,内容与用户相关度的影响在搜索排序中的比重会占到七成。
以沃尔玛这篇新闻稿为例,核心关键词“沃尔玛”和“陈文渊”在标题和首段中分别出现六次和三次,在搜索结果中,相关度更高的网页就会优先推荐给用户。
内容时效性
作为互联网动态更新的时效性内容源,搜索引擎会给予新闻网站以较高的权重。如果内容中带有比较明确的时间点信息(如新闻发生的具体时间),更有机会被搜索引擎作为新鲜的时效性内容抓取,再综合其它(下方)各项指标判定索引和推荐。
如果内容紧贴热点,在百度新闻和网页时效性卡片中获得展示的机会越大。 百度在2017年3月宣布取消新闻源数据库时,其公告中强调的核心根源就是因为“时效性内容识别技术”的升级。
内容质量
所谓内容质量,也就是内容能为用户产生的价值,近一年来非常明显的一个趋势是,百度正在网页和新闻搜索结果中过滤掉没有时效性,或被算法判定为营销内容的结果,即便是内容发布门户网站上,也不会受到靠前的搜索结果推荐。
百度站方曾接受界面采访时提到,“我们有个部门在过去半年时间内一直在调教算法,针对所有百度抓取到的网页,教机器来判断时效性和内容质量,在前端展示上,一些软文会被过滤掉,其他的不会发生太大变化”。
用户参与度
所谓用户参与度,是指构成用户参与的行为有阅读、点击、转评赞等互动行为,这些指标也是构成百度资讯指数的基础。用户对网页内容的参与度越高,搜索引擎认为其重要程度和受欢迎程度越高,页面则更有机会展现给用户。
一般来讲,社交类UGC内容如知乎、豆瓣等,招聘信息、分类信息、电商信息、股市行情等,通常更新频度高,点击量大,搜索结果会靠前。
新闻网站发布的资讯新闻,新闻价值决定用户参与度,看的人越多,搜索结果推荐越靠前,越靠前用户点击越多,累积循环。
相关网页数量
除了搜索直接访问外,用户可能从其它网页链接的点击访问到内容,通过其它网页产生的关联越多,则更有利于长期的搜索长尾。对于站点来讲,内外链的数量,尤其是外部网页指向页面的锚文本数量、质量等,仍是搜索引擎判定网页价值的指标之一。
网页质量
网页的质量包括内容质量、浏览体验、PC和移动端的访问速度,友好程度、能否满足用户的延展需求等。除了对站点的评价之外,百度逐渐强化内容质量的识别评判,综合为内容所在落地页的评价。
尤其在百度取消新闻源数据库后,即使是门户等之前权威的新闻源站点,相同频道的不同质量的内容,获得百度新闻及网页收录的情况也明显不同,被算法综合评判为低质营销目的的软文(非时效性新闻),会被从结果中直接过滤或减少呈现。
关键词竞争度
关键词竞争度,是最容易被忽略和不被了解的因素,但恰恰是影响搜索结果排序最重要的隐藏方面。所谓关键词竞争度,也指关键词热度,指该关键词在百度搜索的热度和收录的相关网页、新闻数量。
举个简单例子,某关键词被用户搜索的频次越高,热度就越高,相关网页,新闻收录的数量越大,竞争度越大,也同时意味着新发布的内容,影响百度搜索结果排序的难度就越大。
关键词搜索的网页收录结果越多,该关键词的热度越高,竞争度越大