为什么Google不收录我的网站?为什么Google搜索不到我的网站?(详)

  很多站长对 Google 收录感到疑惑,有的是因为网站建立有些时间了,却无法在 Google 中搜索到相应结果;有的则是发现 Google 对网站的收录变慢甚至“停止”了……

  Google 对网页的收录,以及其它大部分搜索引擎对网页收录的过程,都可以简化成“抓取 > 索引 > 显示”的模式。

  • 抓取 - 是指 Googlebot 或其它搜索引擎的机器人,访问到网页,然后将网页内容保存到服务器中的过程
  • 索引 - 是指对抓取的网页进行分析,并建立指向该页面的关键词表
  • 显示 - 合格且完成索引的页面,被搜索到匹配的关键词时,才会出现在搜索结果中

 

 新网站不被“收录”的原因

  对于新建立的网站,Google 在抓取到网站的页面之后,首先需要判断网站的主题,决定合适的主题之后,再应用与主题相关的关键词为网页进行索引。这个步骤完成的速度取决于二个因素,一是网站本身内容 (是否明确地围绕某个主题),二是 Google 抓取到的网页数量,数量越多,越容易根据统计原理确定网站的主题。

  这是新站不容易马上完成收录(即出现在搜索结果中)的原因之一,Google 这么做是为了提供更准确的搜索结果。

  另外一个影响的因素是 Google 的“沙盒效应”,即 Google 对新网站设置的一段观察期,在观察期过后且合格的网站才会出现在 Google 的搜索结果中。

  因为现在做垃圾网站的人太多了,如果等到垃圾站做大再进行处罚,倒不如一开始加紧对网站的审查。这样加大了垃圾网站的投入成本,更好的是净化了网络环境。

  根据观察和我实际建站的经验发现,Google 对新网站的“沙盒效应”一般为期 0.5~3 个月,如果超出这个范围,就需要考虑网站自身的一些原因了。

 

网站收录变慢和停止的原因

  导致老网站收录变慢的或者停止的原因,包含但不仅限于以下因素:

  • 网站不符合 Google 的网站质量指南
  • 网站的 IP、主题发生变化
  • 网站的内容增长过快
  • 网站的外链增长过快
  • 服务器故障、robots.txt 配置或者其它原因导致 googlebot 多次无法访问网站
  • ……

  除了这些,《影响搜索排名的因素》中所提到的内容如果出现太大的差异性变化,都可能导致收录变慢或停止。

  有时网站会出现收录停止的假象,可以查看网站的访问日志是否有 googlebot 的踪迹,如果有,说明 google 仍然对你的网站在进行“收录”的前两部分工作 ── 抓取和索引,只是又将你置入“沙盒”了而已。

  老网站只要找出问题所在,对网站做出相应的更改和优化,从“沙盒”中出来比较容易。

  如果 Google 判定你的网站有问题,并停止抓取你的网站,那就是真的危险了,在 Google 删除你的收录内容之前。赶紧排查网站的不利因素,并在解决之后重新向 Google 提交收录申请。

 

  小结

  对于新网站,一两个月之前内看不到搜索结果是正常且可理解的,本站有不少网站建设、优化和推广的文章,能帮你大大减少“沙盒”的时间。

  老网站收录变慢或假停止多少是有点问题,最好请有经验的优化人员帮忙分析,毕竟页面被从 Google 搜索结果中被移除可不是好玩的事。

看完了?还不过瘾?点此向作者提问