我看到Google通过#提出了一个使Ajax应用程序可爬网的好建议/标准! (哈希爆炸)。


他们是否已经在现实世界中使用此“建议”?
是否还有其他搜索引擎-特别是Bing,也正在使用或计划使用它? >

#1 楼

在我看来,这不仅仅是一个提议-Google已经在使用此协议。

我在这里找到了更多信息。他们有足够的文档和常见问题解答,涉及到实际上已经通过这种方式进行爬网的网站...


http://code.google.com/web/ajaxcrawling/
http://code.google.com/web/ajaxcrawling/docs/specification.html


评论


这只是说明了禁用JS / ECMA时,诸如JQuery之类的框架用于使内容可读的技术。对于受人尊敬的Crawler而言,这不是挑战。 :-)

– fwaechter
2010年8月7日13:39

我刚刚更正了上面的第二个链接。如果您查看它,您将看到#!语法的描述与Google的AJAX爬行建议完全相同...这使我强烈建议它已经被使用

– philfreo
2010年8月7日19:16

#2 楼

这只是一个建议,因此尚未被使用(至少没有人宣布已被使用,但对于搜索引擎而言,将其功能保密的情况并不少见。至少有一段时间)。

很难说其他搜索引擎是否会使用它,但是如果它是标准化的,那么它们的可能性就很大,因为它们已经与其他标准化功能(nofollow等)保持同步。通常,提案需要花费一些时间进行讨论和达成共识(例如HTML 5),尽管总有可能某人(例如Google)单方面实施该提案,而其他人则被迫采用该提案只是为了跟上。

#3 楼

我不知道与Ajax完全兼容的搜寻器atm。但是有足够的爬虫/机器人专门研究JQuery,Prototype和其他框架。此外,针对(“良好”)重构JavaScript的一些建议和“快速且快捷”的解决方案也正在趋于稳定。只需在Google Code上搜索。我不知道在此处发布一些链接是否是一个好主意。

Btw:大多数Ajax网站都是完全可爬网的,因为许多用户都使用NoScript之类的AddOn来停用JavaScript。因此,大多数站点都提供了一个后备解决方案。 (也适用于旧版浏览器)。

评论


逐步增强是始终应做到的方式。

–John Conde♦
10年8月6日在20:16

#4 楼

作为更新,Google现已完全支持此协议。但是,Bing目前不支持该协议。