我在允许联合发布内容(通过API和数据转储)的站点上工作。我们发现,即使我们是原始发布者,许多重新发布我们内容的网站在Google搜索结果中的排名也较高。这太令人沮丧了。

我们正在考虑将rel=canonical纳入归因要求的一部分。 Google表示在跨域和联合方案中使用它是合法的。

您这样做了吗?Google是否在搜索排名中考虑规范URL?它会帮助我们减少此类SERP“垃圾邮件”吗?

评论

您所描述的不是垃圾邮件。是人们在做您要他们做的事情-整合您的内容。垃圾邮件是不请自来的电子邮件广告和网页,其创建的唯一目的是用广告轰炸人们,而不是创造任何有价值的东西。如果这些类型的网站可以联合您的内容,则您需要重新考虑您的联合模型,否则将无法很好地反映您的网站(仅通过关联)。但是简单地拥有比您更好的搜索排名并不会导致网站垃圾邮件。

@Lèse真的吗?这些网站似乎直接违反了Google自己建立的“少量或不包含原始内容”规则google.com/support/webmasters/bin/answer.py?answer=66361

@Jeff:您具体指的是哪些网站?我说的是使用网络联合组织本身的行为,这是许多合法站点所做的事情。垃圾邮件站点不必使用联合内容,仅使用联合内容就不会使站点成为垃圾站点(即使它们的排名比您高)。举例来说,许多主要新闻出版物都使用AP提供的联合内容来补充自己的内容。它是重复的内容吗?是。但这是垃圾邮件吗?否。我也不认为AP也在推广垃圾邮件。

@Lèse关键字在这里是其自身内容的补充。如果复制了所有内容,那么到底是在创造什么价值或兴趣?

@Jeff:Matt的问题尚不清楚这些是他所指的网站。他只是简单地说,有些网站重新发布他的内容(这是提供联合发布API的目的),其排名高于原始内容。对我而言,这并不意味着这些(必然)是垃圾网站。但也许我对这个问题的解释不正确。

#1 楼

杰夫在他所说的一切中都是100%正确的。

要求联合站点使用<link rel="canonical" href="http://example.com/foo">的另一个问题是,它告诉Google联合页面不应获得页面排名,而http://example.com/foo应该获得所有页面排名。

这造成了两个主要问题。


企业联合页面由于没有页面排名而根本不会在Google搜索中显示。联合站点对此一点都不满意。
这可能使他们不太可能愿意进行更改。
这可能不会以您喜欢的方式影响您的网站,因为您实际上没有从Syndication网站链接到。我想知道Google会如何处理。的确,它们允许跨站点rel =“ canonical”,但我相信这样做的目的是为了站点迁移,以及在一台主机下的多个具有相同内容的站点拥有一个事实上的页面,而不是一堆相似/相同的页面。


评论


这些是一些优点。我认为企业联合组织是存在重复内容的正当理由的一个领域。在这种情况下,最好不重复重复的内容,并接受那就是联合组织。当然,理想情况下,Google应该优先选择原始页面,而不是联合伙伴的页面。可能需要创建一个新标签,该标签介于rel =“ canonical”和HTML5 标签之间。这样,搜索引擎可以知道哪个页面是合法重复内容的原始页面。

–Lèsemajesté
2010-10-9 4:01



确认,请参阅下面我对Matt Cutts的回复。

–杰夫·阿特伍德
2010-12-11 12:14

#2 楼

我的研究表明,要求链接返回-且不要遵循该链接-是迄今为止最重要的标准。

如果“联合组织”站点未将带有链接回链接的内容归因于对于搜索引擎有效的原始搜索引擎,搜索引擎很难追踪内容的来源,并且必须在整个Internet上应用复杂的“在整个Internet上查找重复的文本内容”启发式方法。

我不确定是否还有其他必要。

相关的Matt Cutts视频

http://www.youtube.com/watch?v=x8XdFb6LGtM


马特(Matt)说,使用rel =“ canonical”指向该文章的原始页面是一个好主意-就像他经常建议的联合组织文章包括常规链接(即指向原始文章的<a>锚标签)。


请记住,规范不仅仅是将rel="canonical"打在<a>标签上。它更像这样:

<html>
    <head>
         <link rel="canonical" href="http://example.com/foo">
    </head>
...


因此,它需要进行不同的工作,您必须修改每个页面标题。我不确定其中许多“合成器”是否具有控制级别,而不是返回源的简单链接(无nofollow!)。

评论


我还建议您阅读Jeff关于此主题的博客条目,要求防御属性-blog.stackoverflow.com/2010/08/defending-attribution-required

–斯科特·米切尔(Scott Mitchell)
2010-10-9 22:24

@scott请注意,我们最初并不需要链接,但是我们进行了更改,因为Google的Spider缺少了数据收集器中某些抓取工具使用的内容……而nofollowed的丢失链接无助于将其放回原处。在Google的索引中!

–杰夫·阿特伍德
10-10-11在6:14

@Jeff:有点切线,困扰我的一件事是Stackoverflow答案中的链接具有rel =“ nofollow”。具有特定代表的用户难道不应该获得对他们发布的链接没有rel =“ nofollow”的好处吗?

–斯科特·米切尔(Scott Mitchell)
2010-10-14 18:30

@scott您的个人资料中的网站字段,在所有Stack Exchange网站上,都以2k rep的名义删除了nofollow。

–杰夫·阿特伍德
10-10-14在19:04

@Jeff,我说的是Stackoverflow答案中的链接。例如,如果我在此页面上进行查看/访问,我会看到您答案中的链接(例如YouTube链接)为rel =“ nofollow”。我认为这是为了阻止垃圾邮件发送者,但与此同时,您似乎正在失去改善与他人的搜索结果相关性的机会,更不用说(在Google的眼中)对撰写此内容的人没有“功劳”文章/博客条目/等被链接到。

–斯科特·米切尔(Scott Mitchell)
2010-10-14 19:50



#3 楼

添加另一个答案是因为我得到了马特·卡茨(Matt Cutts)的肯定答复:


rel=canonical确实可以跨域工作,但是它的行为基本上类似于301 [重定向],因此目标站点的页面将直接访问您在Google中的网站。基本上任何使用您内容的网站都会从搜索引擎中消失。


像Matt一样,认为rel=canonical的最佳方法是301永久重定向。

因此,要求跨域rel=canonical作为一组归因术语就像要求他们301重定向到您!哎哟。 :P

知道这一点,很明显,rel=canonical仅适用于您个人拥有控制权的网站-例如,当您移动域时,您需要一个域的内容来替换另一个域。