什么会导致新GWT中“已发现-当前未建立索引”

新的GWT显示了分为新类别的站点地图链接。两个让我感到困惑的东西：
1。已发现-当前未编入索引
2。已被抓取-当前未编入索引

可能的原因是什么，对整个站点有何影响？这是Google的标志，我应该考虑删除这些标志？

可能有很多原因。其中之一是Google认为该内容对于爬网和索引并不重要或无用。这是针对此问题的修复程序：therealweblog.blogspot.com/2020/07/…

#1 楼

这只是过程的一部分。在您真正遇到错误之前，您无需执行任何操作。

要了解类别，您需要了解索引的工作原理，而索引的工作几乎是连续不断的：

Googlebot获取一个页面，这意味着将其内容下载到Google服务器上。发生这种情况时，将对页面进行爬网。
稍后它将下载的页面的内容放入索引中。这意味着页面已被索引。
在爬网页面时，它会找到喜欢的页面并将其放入队列中。这些链接已被发现。

因此：

发现未建立索引意味着该链接已添加到Googlebot最终可能抓取的事物队列中。由于网络实际上是无限的，并且存在优先级，因此它实际上可能永远无法到达那里。

当前未编入索引意味着该页面已下载到Google服务器上，但其内容尚未插入索引中。

我要补充一点，谷歌根据PageRank决定要抓取的内容。链接到页面的频率更高或更突出（甚至是内部）可以使Googlebot对其进行爬网。

–斯蒂芬·奥斯特米勒（Stephen Ostermiller）
18年2月1日在18:06

我认为“当前未编入索引”也可能意味着Google选择不对其进行索引。它可以重复或看起来质量低劣。它可能没有足够的Pagerank。 Google可能会认为搜索量不足。

–斯蒂芬·奥斯特米勒（Stephen Ostermiller）
18年2月1日在18:08

这就是我对优先级的暗示。可能是重复的链接会发生这种情况（有时是因为它们仅在一个参数上有所不同或与另一个规范匹配）。

–伊泰
18年2月1日在18:14

页面掉进和移出“当前未建立索引”，没有任何我的注意。信息也令人怀疑。范例：经过检查的网址会产生一条消息，指出它已被索引，但没有在任何站点地图中……该页面已在站点地图中存在多年。最近的算法更新使此报告一发不可收拾。

–GLCoder
19-11-22在1:20

#2 楼

Google可能会发现并抓取您的页面，但这并不意味着它将对它们进行索引。

有很多原因导致Google可能无法为页面编制索引。也许它发现重复的内容。也许它没有为任何特定的搜索查询提供足够的价值。 Google可能在您的网页上找到了不受欢迎的内容。

不管是什么原因，Google都还没有决定索引它在您的网站上发现并爬网的某些页面。您的某些页面不被索引是很正常的。尽管我的网站上的某些页面的内容比许多被索引的页面更好，并且具有大量的内部链接，但这些页面并未被索引。 Google的索引系统是一种机器学习算法。因此，出于各种未知原因，它有时可能会决定不对某些页面进行索引。

“也许找到了重复的内容”>我想补充一下，尽管如此，由于该消息是“已发现-当前未建立索引”，因此它表示该页面甚至尚未被提取（否则将被“抓取” -当前未编入索引”）。因此，此时他们对其内容一无所知。因此，我想在此阶段确定优先级取决于URL本身，链接到它的页面数以及可能的其他情况。

– Niavlys
18年1月1日在22:05

#3 楼

Googlebot根据不同的参数有自己的队列。这是关于那些URL甚至都已排队的消息。

Aj Cohn对于此消息的含义有一种有趣的见解：

已发现-当前未编入索引似乎表明他们在您的站点地图中看到了它。但根据其他内容的外观，他们甚至都没有
费力地对其进行爬网。本质上是“丑陋！”或者，也许只是
表示抓取效率不佳。

坦白地说，由于下面的许多示例URL，我并不完全确定Discovered的定义是否准确。此状态具有最近检索的日期。这似乎与提供的定义相矛盾。

我删除了“阅读手册”位。那没有帮助。特别是因为Google的文档非常差。

–斯蒂芬·奥斯特米勒（Stephen Ostermiller）
18年1月31日在17:59

#4 楼

即使Google发现了该URL，它仍然认为花时间进行爬网并不重要。如果您希望此页面获得自然搜索流量，请考虑从您自己的网站内链接到该页面。确保将这些内容推广给其他人，希望您可以从外部网站获得反向链接。指向您内容的外部链接向Google发出信号，表明页面很有价值并且被认为是值得信任的，这增加了将其编入索引的可能性。

编程黑洞网

什么会导致新GWT中“已发现-当前未建立索引”

评论

#1 楼

评论

#2 楼

评论

#3 楼

评论

#4 楼