新的GWT显示了分为新类别的站点地图链接。两个让我感到困惑的东西:
1。已发现-当前未编入索引
2。已被抓取-当前未编入索引

可能的原因是什么,对整个站点有何影响?这是Google的标志,我应该考虑删除这些标志?



评论

可能有很多原因。其中之一是Google认为该内容对于爬网和索引并不重要或无用。这是针对此问题的修复程序:therealweblog.blogspot.com/2020/07/…

#1 楼

这只是过程的一部分。在您真正遇到错误之前,您无需执行任何操作。

要了解类别,您需要了解索引的工作原理,而索引的工作几乎是连续不断的:


Googlebot获取一个页面,这意味着将其内容下载到Google服务器上。发生这种情况时,将对页面进行爬网。
稍​​后它将下载的页面的内容放入索引中。这意味着页面已被索引。
在爬网页面时,它会找到喜欢的页面并将其放入队列中。这些链接已被发现。

因此:




发现未建立索引意味着该链接已添加到Googlebot最终可能抓取的事物队列中。由于网络实际上是无限的,并且存在优先级,因此它实际上可能永远无法到达那里。

当前未编入索引意味着该页面已下载到Google服务器上,但其内容尚未插入索引中。


评论


我要补充一点,谷歌根据PageRank决定要抓取的内容。链接到页面的频率更高或更突出(甚至是内部)可以使Googlebot对其进行爬网。

–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
18年2月1日在18:06

我认为“当前未编入索引”也可能意味着Google选择不对其进行索引。它可以重复或看起来质量低劣。它可能没有足够的Pagerank。 Google可能会认为搜索量不足。

–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
18年2月1日在18:08

这就是我对优先级的暗示。可能是重复的链接会发生这种情况(有时是因为它们仅在一个参数上有所不同或与另一个规范匹配)。

–伊泰
18年2月1日在18:14

页面掉进和移出“当前未建立索引”,没有任何我的注意。信息也令人怀疑。范例:经过检查的网址会产生一条消息,指出它已被索引,但没有在任何站点地图中……该页面已在站点地图中存在多年。最近的算法更新使此报告一发不可收拾。

–GLCoder
19-11-22在1:20



#2 楼

Google可能会发现并抓取您的页面,但这并不意味着它将对它们进行索引。

有很多原因导致Google可能无法为页面编制索引。也许它发现重复的内容。也许它没有为任何特定的搜索查询提供足够的价值。 Google可能在您的网页上找到了不受欢迎的内容。

不管是什么原因,Google都还没有决定索引它在您的网站上发现并爬网的某些页面。您的某些页面不被索引是很正常的。尽管我的网站上的某些页面的内容比许多被索引的页面更好,并且具有大量的内部链接,但这些页面并未被索引。 Google的索引系统是一种机器学习算法。因此,出于各种未知原因,它有时可能会决定不对某些页面进行索引。

评论


“也许找到了重复的内容”>我想补充一下,尽管如此,由于该消息是“已发现-当前未建立索引”,因此它表示该页面甚至尚未被提取(否则将被“抓取” -当前未编入索引”)。因此,此时他们对其内容一无所知。因此,我想在此阶段确定优先级取决于URL本身,链接到它的页面数以及可能的其他情况。

– Niavlys
18年1月1日在22:05

#3 楼

Googlebot根据不同的参数有自己的队列。这是关于那些URL甚至都已排队的消息。



Aj Cohn对于此消息的含义有一种有趣的见解:


已发现-当前未编入索引似乎表明他们在您的站点地图中看到了它。但根据其他内容的外观,他们甚至都没有
费力地对其进行爬网。本质上是“丑陋!”或者,也许只是
表示抓取效率不佳。

坦白地说,由于下面的许多示例URL,我并不完全确定Discovered的定义是否准确。此状态具有最近检索的日期。这似乎与提供的定义相矛盾。


评论


我删除了“阅读手册”位。那没有帮助。特别是因为Google的文档非常差。

–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
18年1月31日在17:59

#4 楼

即使Google发现了该URL,它仍然认为花时间进行爬网并不重要。如果您希望此页面获得自然搜索流量,请考虑从您自己的网站内链接到该页面。确保将这些内容推广给其他人,希望您可以从外部网站获得反向链接。指向您内容的外部链接向Google发出信号,表明页面很有价值并且被认为是值得信任的,这增加了将其编入索引的可能性。