我最近创建了一个sitemap.xml文件,并将其上传到我的Google Webmasters工具帐户。 Google没有报告我上传的站点地图的任何问题或错误。

现在我的问题是:在Google网站管理员工具中工作?

#1 楼

Sitemap文件可帮助搜索引擎发现您网站上的新URL和更新URL。特别是,如果您的网站很大,则可以帮助他们专注于新内容和更新内容,而不必盲目地浏览所有内容以查看是否已更改。这可以使新内容的发现速度更快,尤其是在网站更大或更复杂的情况下,这可能会非常引人注目。

特别是Google(我在Google工作;我不知道其他搜索引擎是如何处理这些问题的),它还会执行以下操作:



为您的网站找到索引网址的数量:这些统计信息每天都会重新计算,而且非常准确。您可以在Sitemaps详细信息页面中找到它们。符合我们在抓取过程中发现的内容。通常这表明您需要进行规范化。

帮助规范化:当您在网站上找到多个显示相同内容的URL时,即使您未使用其他规范化方法,我们也会为Sitemap中列出的所有URL提供额外的优势。

查找网站中索引错误的部分:每个Sitemap文件都提供这些计数,因此您可以为网站的逻辑部分创建单独的Sitemap文件,以发现Google索引不足的区域如您所愿。

优先抓取错误:在“抓取错误”部分,单独列出了站点地图文件中指定的URL。由于您专门提供了这些URL,因此我们假设您希望它们建立索引,并且所有爬网错误都很重要。 ,或国际化),则应选择这样做。这些扩展都是可选的。

对于大多数网站,Sitemaps文件中最可见的元素是您可以看到索引的URL数量。它可能需要一天的时间才能显示出来,因此,如果您是首次提交站点地图,则可能需要耐心等待。虽然其他方式(例如site:-query)非常非常近似,但是此计数非常准确。

编辑添加:关于Sitemaps,我个人觉得非常有用的另一件事是,如果您不是直接用CMS生成它们,则总是会发现很多关于您的网站如何可爬网的信息,以及在此过程中发现了哪种URL。我见过很多情况,使用您身边的工具(例如Sitemaps生成器)爬行网站会冒出您可能会错过的问题,例如URL中的会话ID,通过URL差异复制内容,无限空间(例如作为无尽的日历),甚至是根本没有链接的网站部分。

评论


很棒的信息。我还听说过,在一些人流量大,人满为患的网站上,最好不要使用站点地图,因为Google会更好地进行爬网,如果站点地图中缺少任何内容,它可能会停止索引。

– Chris_O
2012年5月29日在22:18

@Chris_O您正在将不同的问题融合在一起。在那个例子中,并不是说Google独自完成了一个“更好”的工作;而是网站地图本身有问题。这并不是“根本不使用站点地图”的直接论点。解决这种情况的方法是修复站点地图。此外,站点地图仅供参考,而不是指令。站点地图中缺少的内容并不意味着Google不会自己找到它,也不会忽略它。

– Su'
2012年5月30日4:36



该网站有超过4万个被索引的页面,并且新内容在不到5分钟的时间内被索引(没有网站地图)。根据您的回答,我们将开始构建它们并将其分解为数年。

– Chris_O
2012年5月30日下午6:29

@ john-mueller嗨先生。米-我曾经提交了一个包含1000个URL的测试站点地图,我们获得了大约700个索引,现在我们通过以下站点测试了所有1000个URL:www.complete.org/url/to/the/page.html,我们得到了低于700个网址的计数方式(超过200个网址)。这是什么意思?

–弗朗兹
2012年5月30日15:37



@Franz有时涉及到一些细节,这些细节使得使用site:-queries难以重现索引的URL数量。例如,在某些情况下,我们可能会组合多个URL,而仅对site:-query显示其中一个URL。因此,如果您发现那里有所不同,通常就不必担心。

–约翰·穆勒(John Mueller)
2012年6月2日于20:13

#2 楼

如果您没有收到任何错误,则可以假定Google已对其进行了解析并且知道其中的内容。但这并不意味着他们将对这些页面进行爬网和/或索引。站点地图只是告诉搜索引擎您的网页的另一种方式。他们没有义务对任何或所有这些页面进行爬网和编制索引。他们也可以通过链接或URL提交来查找页面。

评论


作为补充信息,很容易看到Google是否了解站点地图。在优化->站点地图下检查。它将告诉您站点地图中已提交了多少个URL。该站点地图已成功读取内容,并在其中找到了很多链接。第二个数字是被索引的数量,正如John指出的那样,完全取决于Google的判断,即它们是否有价值,毫无价值或大部分有价值。它总是小于提交的数量,Google只是发现某些页面不太热门,因此不会打扰他们。

–惨败实验室
2012年5月27日18:36

#3 楼

如果您有很多高质量的链接,那么Google通常会很好地抓取您的网站。如果您花费大量时间查看已索引的页面数,建议您最好改善您的网站并获得一些高质量的链接。

#4 楼

对于较大的网站,例如具有数百,数千或数百万个页面的网站,它非常有用。我们公司网站上有40万个页面,其中URL是通过Content ID动态创建的,URL与&一起使用,Google网站站长工具将为您提供有关已爬网页面的反馈并向您显示错误,您可以调试或打开页面,亲自看看哪里出了问题。这样,谷歌实际上就帮助我们创建了一个更好的网站,并使我们免于几次陷入尴尬的境地。

对于较小的网站,如果网站是一小组.html页面,其中每个页面都是通过菜单链接的,并且网站不经常更新,则如果您上传站点地图,则搜索结果不会改变。与没有上传站点地图的人相比,上传站点地图不会有任何优势。

我过去也有大约20个小型网站,在这些站点中,我是由cron脚本自动生成的,因此我不再这样做。有一天,我发现由于错误而无法正确生成XML文件大约6个月,但是Google幸好忽略了我的错误,即使站点地图有错误,也完全索引了这些网站,Google只是将站点地图用作提示,而不是非常认真

#5 楼

也许像这样的站点地图验证工具,尽管我从未“没有”看到站点地图开始出现。

评论


该文件已被验证。那不是问题。

– Su'
2012年5月27日19:30