寻找一个Windows程序(类似于“ Everything”)可以:


扫描很大的文件(在1000s的文件夹中,有2-3TB,10,000s甚至100,000s的文件)递归目录
对于每个“文本”文件,完全索引其中的所有文本
提供查找给定搜索字符串位于哪些文件的功能。
“文本”文件的最小包含。 txt,.pdf,.epub,.mobi。理想情况下,其他已知的电子书格式(.fb2,.doc,.docx)
需要高级搜索功能(搜索一组搜索项中的所有/任何一个,否定搜索项。理想情况下,正则表达式。在理想情况下,PCRE确实如此)。

可选的所需功能:


支持其他格式的非英语文本,用于索引和搜索;特别是俄语文本(KOI-8,Windows-1251)
支持Unicode(索引和搜索)。
可以浏览档案(至少是.zip和.rar)
良好的GUI(例如“一切”应用)以显示搜索结果。快速筛选的网格,每个找到的文件的操作菜单,包括复制位置,打开包含文件夹,复制/剪切文件的方式,就像在Windows资源管理器菜单中一样。
在文件系统中添加/删除/更改文件时自动保持索引刷新,一切都可以。
理想情况下,免费提供,但只要价格合理就不需要。
需要Windows XP。 Windows8额外奖励积分。


评论

不错的科幻收藏!

下次,请在您的问题中标记特定的操作系统。您还说过WindowsXP是必需的,但是您将其放入了可选功能中。请说清楚。我错过了这一点,并为Windows 7(我相信它将与Win8配合使用)写了一个答案,我仍然会发布。

@ Yos233-我宁愿拥有一个只有8个软件的好软件,而不是没有(我可以根据需要将集合从XP迁移到8个软件)。但目前它在XP系统上。

请记住,正则表达式/ PCRE与索引方法不兼容。正则表达式搜索无法利用全文索引,因为全文索引中没有足够的信息可用于正则表达式。对于基于正则表达式的方法,您需要执行经典搜索。

#1 楼

据我所知,Windows 7资源管理器具有所需的所有基本功能以及一些可选功能。


您可以在Windows中索引文件目录(7+ )两种方式。直接索引目录,或使其成为库。直接索引:参见此处:wikiHow:如何将文件夹添加到Windows 7文件索引

创建库:在资源管理器,转到“库”,然后单击“新库”。


Windows中的高级搜索只是我要查找的内容,但是How-To Geek有一个关于这方面的信息非常丰富。文章

还请确保您已启用文件内容搜索:wikiHow:如何使Windows 7搜索文件内容


附录:写完此后我注意到OP要求使用Windows XP。即使其他人不接受它,我也要坚持下去(所以我没有浪费30分钟)。

评论


它的缩放程度如何?具体来说,它可以有效地处理问题中所述的大小,而不会造成索引和搜索系统陷入困境吗?可以索引文本PDF的内容吗? EPUB?

–DVK
2014年9月9日23:32

我认为资源管理器不会使系统陷入困境(以可能会降低搜索速度为代价)。可以通过Adobe IFilter .dll(adobe.com/support/downloads/detail.jsp?ftpID=4025)进行PDF索引编制。我找不到EPUB的类似产品,因此可能找不到。

– Yos233
2014年10月10日,0:23

不会陷入困境吗?它使打开(忘记搜索)其中包含数千个文件的目录陷入困境!!!

–DVK
2014年10月10日,0:41

你问了这个问题,我给你最好的答案。对我而言,使系统陷入瘫痪是指减慢其他进程的速度(例如CPU吞噬)。是的,当然,搜索数千个文件将需要一些时间。我认为您不会找到一个可以以极大的速度搜索可观库的程序。

– Yos233
2014年10月10日,0:58

我指的不是索引。我指的是显示结果。一切都可以迅速显示数千个结果。 Windows资源管理器将被冻结

–DVK
2014年3月10日在1:37

#2 楼


Regain(桌面搜索)



您可以在Wikipedia上找到桌面搜索管理器的列表,但我认为Regain开放源代码项目是一个明智的选择,此外它是免费的(如在libre中一样),也是开源的,并且仍在开发中,这意味着将出现新功能(此处有完整功能列表)。

简短说明

Regain是Java基于Jakarta Lucene的搜索引擎。它提供索引和搜索文件的多种格式(HTML,XML,doc(x),xls(x),ppt(x),oo,PDF,RTF,mp3,mp4,Java)。 TagLibrary使您可以轻松地将搜索结果集成到基于JSP的网页中。

主要功能非常有用:


Web服务器(因此可以在LAN中访问在局域网中的所有设备上)
托盘图标(快速访问)
索引文件的缓存版本(有时不加载大型PDF无需付费)
搜索关键字(强大的Lucent关键字集)
可以支持其他格式(再次支持I-Filter)
支持API

只需几个快照:





评论


我很想使用它,但是缺少文档...

–马特
17年8月24日在17:09

#3 楼

Copernic Desktop Search

对于基于全文本的方法,请使用Windows Search或Copernic Desktop Search(完整版50美元,用于非商业用途的免费版本(“ Lite”)限于75,000个文件)。 br />
特别是Copernic Desktop Search具有您需要的所有功能。我已经用4,000,000个文档对其进行了测试,但是搜索仍然非常快。它可以识别AND,OR,NOT,NEAR之类的运算符来支持您的搜索。

#4 楼

也许DocFetcher可以提供帮助。
从主页:

该应用程序可以在Windows,Linux和Mac OS X上运行,并且可以在Eclipse Public License下获得。
值得注意的功能


可移植版本:DocFetcher有一个可移植版本,可在Windows,Linux和Mac OS X上运行。此用法的用途更详细地描述了
。页面。

64位支持:同时支持32位和64位操作系统。

Unicode支持:DocFetcher随附所有主要功能的坚如磐石的Unicode支持格式,包括Microsoft Office,
OpenOffice.org,PDF,HTML,RTF和纯文本文件。唯一的
例外是CHM,我们尚不支持Unicode。

存档支持:DocFetcher支持以下存档格式:zip,7z,rar和整个tar。 *家庭。可以自定义zip存档的文件扩展名
,从而使您可以根据需要添加更多基于zip的存档格式。此外,DocFetcher可以处理无限的存档嵌套(例如包含7z存档的zip存档
包含rar存档的zip等等)。

在源代码中搜索代码文件:可以自定义DocFetcher识别纯文本文件的文件扩展名,因此您可以
使用DocFetcher搜索任何类型的源代码和其他基于文本的文件格式。 (与
可定制的zip扩展结合使用时效果很好,例如,用于在Jar文件中搜索Java源代码
。)

Outlook PST文件:DocFetcher允许搜索Outlook电子邮件,通常是Microsoft Outlook存储在PST文件中。

HTML对的检测:默认情况下,DocFetcher会检测HTML文件对(例如,名为“ foo.html”的文件和名为
“ foo_files”),并将该对视为单个文档。最初,此功能
似乎没什么用,但事实证明,此功能
在处理HTML文件时,大大提高了搜索结果的质量,因为HTML文件夹中的所有“杂物”都会从结果中消失。

Regex-基于索引的文件排除:您可以使用正则表达式从索引中排除某些文件。对于
示例,要排除Microsoft Excel文件,可以使用正则表达式
,如下所示:。*。xls

MIME类型检测:可以使用正则表达式将关于某些文件的“ MIME类型检测”,这意味着DocFetcher将不仅尝试查看文件名,而且还会通过窥视文件内容来尝试检测其实际文件类型。强大的查询语法:强大的查询语法:除了OR,AND和NOT之类的基本结构外,DocFetcher还支持以下功能:通配符,
短语搜索,模糊搜索(“找到与...相似的单词”),
邻近搜索(“这两个单词之间的距离不得超过10个单词”) ,提升(“增加包含
的文档的分数...”)

支持的文档格式

Microsoft Office(doc,xls,ppt)
Microsoft Office 2007及更高版本(docx,xl​​sx,pptx,docm,xlsm,pptm)
Microsoft Outlook(pst)
OpenOffice.org(odt,ods,odg,odp,ott,ots,otg, otp)
便携式文档格式(pdf)
EPUB(epub)
HTML(html,xhtml,...)
TXT和其他纯文本格式(可自定义)
富文本格式(rtf)
AbiWord(abw,abw.gz,zabw)
Microsoft编译的HTML帮助(chm)
MP3元数据(mp3)
FLAC元数据(flac)
JPEG Exif Metada ta(jpg,jpeg)
Microsoft Visio(vsd)
可缩放矢量图形(svg)



#5 楼

WinGrep

即使在二进制文件中,您也可以按需搜索给定的单词(注意:对于某些PDF(例如来自扫描仪的PDF),此方法不能很好地工作)。使用wingrep-它是免费的,甚至可以在.zip文件中搜索。我不会一直在降低PC的运行速度,也不会使用大量的磁盘空间,因为它不会建立索引,但结果却运行得不那么快。它是Micro $ oft的免费版本,因此可能适用于大多数Windows版本。可以编辑元数据,但是口径具有以下功能:


专门用于维护电子书库,
可以为您转换格式,
包括查看器多种格式,
可以在大多数设备上管理电子书。

它是免费和开源的,几乎可以在任何地方运行。

无论您做什么,我都强烈建议您使用它。