如果Google提供了正则表达式搜索,这将非常有用。

有没有办法做到这一点?

(OBS:我不是在谈论像site:这样的错误正则表达式,filetype:ANDOR"Text"。我想使用诸如.+[]^之类的正则表达式进行搜索。

#1 楼

传统Google搜索中没有此功能,而Google的路线图中也没有此功能。您可以观看Google视频,以了解有关此主题的更多信息。Google是否会实现使用正则表达式进行搜索的功能?

但是有一个例外。 Google代码搜索支持正则表达式。当然,此主题搜索引擎的搜索目标只是源代码。

值得一提的是,某些Google搜索关键字可以部分替换正则表达式。例如,如果要搜索“搜索术语”的任何两个单词的变体,则可以使用通配符。

search *


将找到搜索结果以及任何其他(一个)词。我经常用它来检查基本的英语语法规则或同义词(例如,“ *一样简单”)。

评论


Google代码搜索已不存在,但可能还有其他选择(并非与此问题相关)

–musefan
13年8月29日在10:29

现在,此答案有些过时了:请参阅此答案,例如Google正则表达式搜索。

–安德森·格林(Anderson Green)
15年8月25日在17:23



#2 楼

Google搜索可以返回一些简单正则表达式的匹配项。
例如,搜索查询
"(gray|red) (wolf|fox)"
("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")

等效。您可以看到输出
Google搜索还允许在搜索字符串中使用“通配符”字符,因此您可以找到"the quick brown * (jumped|jumps) over the * dog"之类的模式的搜索结果。

评论


我正在搜索药品或化学名称。我可以阅读“血红素晕”字样,其中问号难以辨认。 Google无法帮助您。

– SDsolar
17-10-11在1:09



#3 楼

SymbolHound除了包含符号的网络搜索(包括对与编程相关的站点(例如Stackoverflow)编制索引)之外,还具有开源代码存储库搜索,类似于现已停产的Google Code Search选项。

评论


如果您是SymbolHound的会员,请在个人资料中注明。谢谢!

–codingbadger
2012年1月20日上午11:18

#4 楼

您可以编写软件来:


从正则表达式中获取关键字;
Google关键字并获得结果列表;
检索每个结果URI并使用完整的正则表达式对其进行过滤。

让我们研究一个案例:从site:gog.com查找所有具有西班牙语配音的游戏。

正则表达式为:

Audio[^:]*:[^.,]*Spanish


它应该匹配,例如:

Audio lanuage: English, German, Spanish, French.


不匹配:

Audio language: only-English. Text language: Spanish.


步骤1。让您的软件在Google上进行搜索:

site:gog.com audio Spanish inurl:game


inurl:game此处仅表示在游戏说明页面中进行搜索

第2步。获取300个结果链接并爬入其中的每个链接。

第3步。使用给定的正则表达式过滤结果:

Audio[^:]*:[^.,]*Spanish


这应该很容易构建。实际上,我不明白为什么我找不到那种已经建立好的东西。

由于搜索引擎无法负担使用正则表达式扫描数据的资源,因此这项工作很脏方面,您的计算机应该使用搜索引擎已经提供的功能来实现。

评论


+1。多谢。实际上,这是一个非常有趣的想法。主要问题是我们可能需要高性能集群来做一些真正有趣的事情。

–加鲁丹
13-10-25在19:05



嘿,我正在写这个扩展。

– Navin
2014年11月2日,10:10

#5 楼

不,很遗憾,不是:(。从理论上讲,您可以创建自己的搜索引擎并进行搜索,但这将非常困难。

#6 楼

仅供参考,Google在搜索运算符方面的帮助在这里。

有趣的是,“-”仍然是排除单词的运算符,但他们删除了“ +”作为运算符,过去使用它来要求给定搜索词。显然,“ +运算符在启动Google+时就已经退休,因为+是可搜索字符而不是运算符。”(https://support.google.com/websearch/answer/2466433)

#7 楼

您可以从详细的Google搜索开始,以剔除要搜索的目标文本。然后打开多个标签中的前50个结果,然后使用mingyi的“最快搜索” Firefox插件使用正则表达式搜索结果。

#8 楼

Google现在支持并完整记录RegEx的使用。这是参考链接:
http://www.google.com/support/enterprise/static/postini/docs/admin/zh-CN/admin_ee_cu/cm_regex.html

评论


仅用于Postini。

–ale
2013年12月27日在16:24

#9 楼

如果您了解VBA,则可以编写一些代码以将数据从Web获取到Excel。我日夜运行该程序,可以获得数百万个结果。之后,您可以从这些结果中进行过滤。

评论


哦,上帝...宽恕我们的罪过

– beppe9000
16年7月25日在19:49