什么是石榴算法,百度搜索引擎石榴算法分析?

2012年5月17日下午,百度网页搜索反作弊团队在百度站长平台发布公告称:将于一星期后正式推出新的算法“石榴算法” 。新算法前期将重点整顿含有大量妨碍用户正常浏览的恶劣广告的页面 。百度称此举是为了尊重搜索的用户,净化互联网生态环境!如图1 。石榴算法第一期针对含有大量低质弹窗广告及大量混淆页面主体内容等垃圾广告的页面算法升级 。

什么是石榴算法,百度搜索引擎石榴算法分析?


图1 石榴算法百度官方公告
石榴算法上线后,广告少、无弹窗的优质页面排序有所提升,相应的含有恶劣弹窗、大量混淆页面主体内容等垃圾广告的页面排序会大幅下降 。
根据百度官方的公告不难推测,这次石榴算法的更新应该只是1.0版本,接下来可能会有一系列的动作,那么除了恶意弹出广告会影响网站整体的排名之外,还有那些内容在不久的将来也可能会被石榴算法击中呢?以下CRAZYSEO工程师针对石榴算法做了一些深入的分析,供大家参考 。
1.模板信息过多
一个网页上几乎全是模板内容,右边栏,左边栏,主导航,底部导航 。这种页面的信噪比过低,对用户不能产生很直接的帮助,同时也会造成搜索引擎资源浪费,这些页面很可能会被将来的石榴击中从而被删除索引库 。
2.采集、抄袭、伪原创
一直以来百度对原创内容没有很好的识别机制,往往大站转载小站的原创内容后很可能会认定后者是抄袭者 。百度也多次声明会改善这样的机制,否则没有人愿意去写高质量的文章,对百度来说也没有好处,而且目前360势头很猛,一旦360先行一步,研发出这样的识别机制,势必会赢得更多站长的芳心,那么对百度来说打击无疑是很大的 。
所以在之后推出的石榴算法中是否能够对一些恶意采集、抄袭和伪原创的内容做相应的措施?本书的后面章节中作者将对伪原创和原创等内容进行深入的分析,这里我们首先需要明白原创并不一定就是搜索引擎喜欢的内容,搜索引擎的搜索结果毕竟是为了用户找到信息,因此这些内容必须是对用户有价值的 。
3.大量无价值翻页
大网站由于内容过多势必会有一些翻页机制,而有些翻页由于程序本身的问题会返回空内容,而这些空内容页面很可能权重不低,因为翻页链接是全站的,所以这个页面很可能收到许多其他页面指向的链接 。另外一种翻页是把一篇完整的文章分成很多页数,当然利用翻页机制把过长的文章分页固然是有利于用户体验,但是有些别有用心的站长完全是为了增加页面收录量,把一些看似很短的文章页给他翻个十几页,这样的体验对用户而言是非常讨厌的,搜索引擎最终也会对其进行惩罚 。
4.相似内容过多
这个现象在论坛里面出现的比较多一点,有些人为了获得积分大量复制黏贴其他人发的文章,这样会造成搜索引擎收录过多重复内容从而对网站进行惩罚 。所以,论坛的监控还是比较重要的,最好采用邀请机制,通过程序设置尽量避免刷帖事件的发生,也不鼓励通过发帖的量来提升自己的地位或是等级,内容多没有用,内容精才是王道 。
5.自动回复页面
很多博客、论坛为了刷人气,往往在有新内容生成的时候会用机器人自动回帖、顶贴,给人一种很热闹的感觉 。但是仔细看我们会发现,其实这些所谓的评论都是实现设定好的,倘若把这些评论放到搜索引擎上搜索一下,会出现千千万万雷同信息 。这些为了专门骗取关注度或者吸引蜘蛛资源而生成的内容一定会受到百度新算法的惩罚 。
【什么是石榴算法,百度搜索引擎石榴算法分析?】

推荐阅读