1。已发现-当前未编入索引
2。已被抓取-当前未编入索引
可能的原因是什么,对整个站点有何影响?这是Google的标志,我应该考虑删除这些标志?
#1 楼
这只是过程的一部分。在您真正遇到错误之前,您无需执行任何操作。要了解类别,您需要了解索引的工作原理,而索引的工作几乎是连续不断的:
Googlebot获取一个页面,这意味着将其内容下载到Google服务器上。发生这种情况时,将对页面进行爬网。
稍后它将下载的页面的内容放入索引中。这意味着页面已被索引。
在爬网页面时,它会找到喜欢的页面并将其放入队列中。这些链接已被发现。
因此:
发现未建立索引意味着该链接已添加到Googlebot最终可能抓取的事物队列中。由于网络实际上是无限的,并且存在优先级,因此它实际上可能永远无法到达那里。
当前未编入索引意味着该页面已下载到Google服务器上,但其内容尚未插入索引中。
评论
我要补充一点,谷歌根据PageRank决定要抓取的内容。链接到页面的频率更高或更突出(甚至是内部)可以使Googlebot对其进行爬网。
–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
18年2月1日在18:06
我认为“当前未编入索引”也可能意味着Google选择不对其进行索引。它可以重复或看起来质量低劣。它可能没有足够的Pagerank。 Google可能会认为搜索量不足。
–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
18年2月1日在18:08
这就是我对优先级的暗示。可能是重复的链接会发生这种情况(有时是因为它们仅在一个参数上有所不同或与另一个规范匹配)。
–伊泰
18年2月1日在18:14
页面掉进和移出“当前未建立索引”,没有任何我的注意。信息也令人怀疑。范例:经过检查的网址会产生一条消息,指出它已被索引,但没有在任何站点地图中……该页面已在站点地图中存在多年。最近的算法更新使此报告一发不可收拾。
–GLCoder
19-11-22在1:20
#2 楼
Google可能会发现并抓取您的页面,但这并不意味着它将对它们进行索引。有很多原因导致Google可能无法为页面编制索引。也许它发现重复的内容。也许它没有为任何特定的搜索查询提供足够的价值。 Google可能在您的网页上找到了不受欢迎的内容。
不管是什么原因,Google都还没有决定索引它在您的网站上发现并爬网的某些页面。您的某些页面不被索引是很正常的。尽管我的网站上的某些页面的内容比许多被索引的页面更好,并且具有大量的内部链接,但这些页面并未被索引。 Google的索引系统是一种机器学习算法。因此,出于各种未知原因,它有时可能会决定不对某些页面进行索引。
评论
“也许找到了重复的内容”>我想补充一下,尽管如此,由于该消息是“已发现-当前未建立索引”,因此它表示该页面甚至尚未被提取(否则将被“抓取” -当前未编入索引”)。因此,此时他们对其内容一无所知。因此,我想在此阶段确定优先级取决于URL本身,链接到它的页面数以及可能的其他情况。
– Niavlys
18年1月1日在22:05
#3 楼
Googlebot根据不同的参数有自己的队列。这是关于那些URL甚至都已排队的消息。Aj Cohn对于此消息的含义有一种有趣的见解:
已发现-当前未编入索引似乎表明他们在您的站点地图中看到了它。但根据其他内容的外观,他们甚至都没有
费力地对其进行爬网。本质上是“丑陋!”或者,也许只是
表示抓取效率不佳。
坦白地说,由于下面的许多示例URL,我并不完全确定Discovered的定义是否准确。此状态具有最近检索的日期。这似乎与提供的定义相矛盾。
评论
我删除了“阅读手册”位。那没有帮助。特别是因为Google的文档非常差。
–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
18年1月31日在17:59
评论
可能有很多原因。其中之一是Google认为该内容对于爬网和索引并不重要或无用。这是针对此问题的修复程序:therealweblog.blogspot.com/2020/07/…