一直以来我们都是将百度收录量作为SEO的参考依据,如图1中,使用SITE指令查询到的收录条数就是收录量。百度站长工具上线之后推出了索引量查询工具,这两者的数据存在一些差异,这样的差异让很多SEOER摸不着头脑,不知道究竟应该参考那个数据,下面CRAZYSEO工程师就这个问题为大家做深入的解读。
搜索引擎索引量和收录量的关系
图1 豌豆壳site指令结果
收录量是指搜索引擎对网站页面的收录数据,结合索引来理解,就是蜘蛛首先爬取网站,建立一个索引库,然后放出的页面数量就是收录量,一般Site命令查询出来的数据结果就是收录的数据,这个数据不是非常准确,作参考指标。收录意味着每个页面至少会对应一个网页快照,快照页面是参与SEO排名的,所以收录量越多,参与SEO排名的页面也就越多,相对来说获得流量的范围就越大,当然,能获得多少SEO流量还是要看页面的排名和关键词的热度。
由此可以看出收录量是索引量的子集,只要搜索引擎蜘蛛爬行页面就会对网页进行索引,而索引之后并不一定将索引的结果放出来,如果网站的收录量长时间和索引量有很大的差距,说明网站应该注意内容的质量,CRAZYSEO工程师在SEO诊断中经常遇到这样的问题,一些站长的网站蜘蛛爬行非常迅速,文章发布后几分钟就进入索引库,但是这些索引只有很少的部分被放出来,分析后发现文章都是采集而来,只是经过了简单的伪原创就发布出去,这就是导致收录量一直无法提升的原因。
所以说对比收录量和索引量就能分析出网站内容是否合格,如图2是CRAZYSEO工程师个人网站的收录量,如图3是索引量,引量完全相同,说明CRAZYSEO工程师发布的每一篇文章都被搜索引擎顺利抓取。
搜索引擎索引量和收录量的关系
图2 axingweb site指令结果
搜索引擎索引量和收录量的关系
图3 百度站长工具索引量
关于百度索引量百度官方给出的解释:索引量仅指被百度搜索引擎建立了索引的网页总量,表示网站中有多少页面可以作为搜索候选结果,不同网页因内容重要性、稀缺性不同,被展现的几率有很大差别。
索引量是蜘蛛对一个网站内容页面的抓取、整理所形成的一个数据库,网站的页面越多,这个数据库就应该越大,现在百度已经有官方的工具可以查询网站的索引量数据,这个数据相对来说还是比较准确的,和SEO虽然没有直接的关联,不过对于收录还是有一定指导作用。
从SEO角度来说,索引量是第一步,蜘蛛抓取网站,建立索引页面;收录是第二步,蜘蛛根据页面内容和权重等因素放出网站的快照页面,从而可以参与关键词的排名;第三步就是关键词排名优化,争取获取更多的SEO流量。
一般来说,索引量数据大于收录数据(如图4所示),特别是对于新站来说,刚开始面临一个审核周期,索引数据不断增加,而收录很难增长,这需要一些时间,不过当索引量高于收录很多的时候,就要注意了,应该是文章内容的问题,这时应该增加原创文章的更新,尽量减少转载,特别是一些低质量内容的转载。
搜索引擎索引量和收录量的关系
图4 百度站长工具索引量
也有不少情况是索引量少于收录量的,我的这个网站现在就是这种表现,索引数据4000左右,收录快到5000了,这个有可能是数据的不准确造成的,也有可能就是索引的页面放出情况良好,对应了多个快照页面,造成收录高于索引,要注意的是这两个数据应该相差不会太多,相差太大的话一般都是网站出现了问题,有人可能会说我的网站索引量和收录量完全一致,是不是就不存在问题,其实,收录数据(Site命令)是实时变动的,也不是非常准确,如果索引量和收录量完全一致的话,我只能说是巧合。
索引量和收录数据能够在一定程度上反映出蜘蛛对网站喜好和信任程度,单纯的看这两个数据还是不够的,还要结合网站的页面数量,快照的更新时间以及网页的收录时间等,通过综合的数据表现,发现网站潜在的问题,评估工作内容的效果和下一步工作重点。
索引量的多少一般由网站页面数量决定,要想索引量不断增加,就需要创造高质量的页面内容,不断吸引蜘蛛爬取,索引量数据出现了大的波动,蜘蛛抓取的次数和频率也会有相应的变化,这种变化是关联的,收录也会随着索引的增加而增长,两者的数据可能不一致,但是这种变化趋势应该一致,这种数据趋势可以体现出网站目前的状态,对后续的SEO工作有很大的指导作用。
CRAZYSEO工程师建议读者在日常SEO优化过程中要养成分析这些数据的习惯,这些数据的背后往往隐藏着很大的问题,收录量大于索引量或者收录量小于索引量都对应网站存在的问题,针对这些问题在日后的SEO过程中进行调整,这才是SEO的最高境界。
本文作者:张新星