在使用Lucene.NET遇到性能问题之后,我们决定进行更改,然后将网络转移到Elasticsearch。

这里是开始的地方:https:// stackoverflow .com / search

有效的方法:


所有搜索运算符都应位于
以下是旧搜索行为的许多变化

区别在于:


新的搜索是AND,添加搜索词会缩小搜索结果,而不是扩展搜索结果。
搜索结果的外观现在更加统一在问与答之间存在以下区别:


“ Q:”或“ A:”前缀
问题中将存在答案计数和标记。
答案计数如果被接受,将以绿色突出显示。
(稍后我们可能会为其他内容编制索引,这就是为什么结果现在更通用/ google-y的原因。)


它更快,在大型网站(如Stack \ Overflow
)上,几乎所有搜索的速度都提高了约5-10倍,除了大小写敏感外,引用的短语完全匹配例如,您可以搜索代码或符号。
如果不在带引号的短语中,单词现在将被词干(例如)
与上下文相关的摘录将更相关
现在已明确支持(例如-term-"my phrase"
我们不再关注该问题,如果您搜索与答案匹配的内容,我们将直接在搜索结果中为您显示答案
每分钟搜索的限制实际上已经消失了,它将阻止一个漫游器,但是没有其他人可以攻击它。尽管infavorites:mine又回来了,但仍在监控性能,其中infavorites:12345(任何用户ID )已添加

需要做什么:


您告诉我们的内容已损坏...做您最糟糕的事情。

进行测试,而不是最终版本:


新的范围支持,下面是一些示例:



answers:1..1(恰好一个答案)

answers:10..20(10至20个答案)

created:2008..2009(在2008年1月1日至2009年12月31日之间创建)

created:2010-04..2010-05(在2010年4月1日至2010年5月31日之间创建)

created:2011-01-05..2011-01-06(请注意:它将在一天中结束)
此范围语法适用于新的高级运算符:lastactive:以及其他数值范围views:score:另外,如果您完全忘记了它(例如score:20-30),则上面的语法稍微灵活一些,尝试尽可能直观,请尝试一下-告诉我们您的想法。



在默认设置之前,我会尽力改善搜索条件。至少,我们希望它在相关性和功能性之前等效切换,但理想情况下要好得多。直到那时我们才会切换。

请尝试一下,告诉我们您在这里的想法,我们会在假期允许的范围内不断改进它。请记住,如果我们对结果进行更改需要重新编制索引,那么在此测试期间您可能会获得离线搜索页面,甚至在MetaStack Overflow上仅能持续大约两分钟。

最坏的情况,将结果与旧搜索进行比较,告诉我们哪些更好,哪些不是。我们期待收到反馈。

更新现在,新搜索已成为网络上的默认搜索-我们将在接下来的几天中进行监控,并希望您收到在此处看到的任何疯狂行为的报告。

评论

“你告诉我们的事坏了……尽你所能。” -邪恶的笑容。

有关性能问题的更多信息吗?有博客文章或类似文章吗?

@redsquare-如果有足够的兴趣,我可以在博客上的博客文章中详细介绍...基本上,我认为没有人在我们的负载级别上使用Lucene.net,因此没有人遇到文件锁的性能瓶颈,因此辛苦了。

因此,您仍在使用Lucene,只需在其上放置一个分片服务器即可。 elasticsearch是一个很棒的产品,令我惊讶的是这种事情没有很快发生。

我听说您使用了我的一位同事编写的用于.NET的NEST Elastic搜索客户端。棒极了!辛苦了!

我们都很感谢,但是让我们留下搜索的反馈意见(错误,增强功能等),仅是因为这是一个需要大量关注的领域,如果要移至主站点,我们需要确保一切都解决了。

@Rahul-的确,我一直在与作者合作,以改善对我们来说必不可少的某些方面……我目前正在StackExchange分支中提交运行状况API的各个部分,但希望它们很快会在主要回购中。

@JollyOldSaintNicholas-绝对不是一个小小的变化,elastic很棒,但是缺少一些我们将要依赖的功能,例如批量UDP(仅在十月添加,等等)。不过,更笼统地说,我们团队的工作并不乏...在一周前,搜索成为俄勒冈州服务器上的一个主要问题之后,搜索工作得到了优先发展。将完全基于Java的东西带入我们的堆栈(没有其他Java,并且现在我们必须在Windows服务器上运行)也不是一个明显的胜利,必须非常值得...但是就是这种情况。

@NickCraver服务器设置(例如,是否与Redis安装程序在同一服务器上运行)可能会写出很好的Server Fault博客文章。另外,您有没有得到你们在Careers上发布过的那个搜索分析师,或者这是在那个职位之外完成的(无论是否被填补)?

@NickCraver“我们现在必须在Windows服务器上运行...”嘿,现在,您应该等Jeff离开之后再整整一年才开始暗示这一点。 :)

@TravisJ-除非您使用引号(在一个单词或短语中,都可以使用一个引号),否则在起作用。在这种情况下,我们完全尊重您要搜索的内容。这就是google的运作方式...尽管在某些情况下我们可能会使用每个站点的词干分析器-我们会不断调整以提高结果。

我想它的实用程序有限,但如果可能的话,..#也可能对所有<=#都很好。就像score:..#或created:.. 2009一样,所以我不必猜测最小值是什么(或者对于最小值0的运算符可以懒惰)

我喜欢右边的新高级搜索下拉列表,因此对于那些总是忘记语法的运算符,我不会被带到高级搜索页面。

@ShaWizDowArd因此是“有效”一词。我认为要注意的是它仍然存在并且会阻止机器人,这很明显。

词组搜索不完全符合广告宣传要求:meta.stackexchange.com/q/296120/169168

#1 楼

状态完成问题结果界面比旧界面差很多。比较:








是的,新界面更加紧凑,但是其中一些有关帖子的最重要信息-投票,视图,答案的数量以及它是否具有可接受的答案,或者丢失(对于视图而言),或者降级为次要位置,这在快速浏览列表时很难看到。新的搜索列表与网站上所有其他问题列表的区别令人讨厌,并且需要一些时间来习惯。

简而言之,新界面看起来好像是Google或任何其他通用搜索引擎的界面。我完全使用Stack Exchange的搜索的原因是(除了其他搜索选项之外),该界面是问题所独有的-如果我想像在Google上那样将结果显示为列表,我会使用Google。


与界面问题分开,对于许多查询,引擎现在都返回问题和答案。通常,这是一个好主意,除了大部分时间我认为这不是必需的。就个人而言,我认为标签搜索(例如[minecraft] crafting)返回答案不是很有用,特别是因为仅搜索[minecraft]只会给您一个问题列表。它还带来了很多不必要的重复项。当然,我可以添加is:question,但是我认为默认情况下不应为这些搜索显示答案。

状态已完成尽管这可能是适应新引擎的问题,但还有其他一些查询根本没有任何答案可以包含答案。例如,除非明确要求,否则[minecraft] closed:0不应返回答案。


杰夫(Jeff)的评论提示了另一个建议:将答案和他们的问题组合在一起放在搜索结果中可能会更好。新搜索引擎的最大问题之一是,如果我不向查询中添加is:question,那么当一个问题以及对该问题的多个答案出现在我的搜索结果中时,我会得到很多重复。如果我确实添加了is:question,现在我可能会错过可能包含我的查询的答案。

评论


@NickCraver我认为将不同类型的帖子的样式(非常)不同(很好)是可以的(最好是均匀的),假设这只是界面问题,而不是新的搜索后端无法更灵活地显示不同类型的职位。视图是有用的,因为具有大量视图(10k +)和低分的问题可能表示有问题的问题。您是否有任何评论:带有标签的搜索?

–易江
2013年1月5日在6:04



特别是,我感到无法一眼就能看到收视率和观看次数,这是Stack的独特标志。使所有结果看起来都一样。实际上,只有一块格式相同的段落很难动态读取(在超文本意义上)。

–brasofilo
2013年1月5日7:40



我不太在乎视图的数量,但是使答案和投票的数量更加突出将很有用。

–叙利亚
13年1月5日,11:58

拜托,拜托,请切换回旧版用户界面。快速浏览票数,答案等需要花费很多精力。这是我用来确定问题是否值得研究的信息。

–布莱恩·丹尼(Bryan Denny)
2013年1月5日23:34

我还发现新的结果UI非常差。是的,旧的SE与其他网站截然不同,现在我甚至认为这是一个“愚蠢”的Google自定义搜索。是的,即使是透视问题的旧式设计也很容易提供信息。旧的彩色框使页面脱颖而出,在视觉上更有趣,有助于聚焦。很容易发现那些被标记为“有用”(高票数)的人和需要注意的人。现在所有这些都丢失了。我发现此更改在特性,实用性和可用性上都是一个主要的功能损失。

–n611x007
13年1月6日在16:24



我一次又一次听到的反馈非常具体:分数和答案数必须更明显。我们明天将尝试调整格式,以使这些内容一目了然,同时仍能很好地处理非问题/答案结果类型。

–尼克·克拉弗♦
13年1月6日在21:38

@NickCraver尽管我喜欢新的搜索功能,但我必须同意有关UI的答案。现在,除了简单地浏览搜索结果以轻松找到所需的项目外,我还必须阅读每个搜索结果以查看它是否是我想要的项目。它要花费更多的时间,尤其是在我的大脑感觉无法以100%的速度运转的日子。这对于答案,票数,是否存在一个可接受的答案,在视觉上脱颖而出,以及问题和答案在视觉上是否可以用文本中的Q或A隔开是很好的。

–雷切尔
2013年1月7日在16:58

您无需稍微更改格式。回到你拥有的东西,太好了!现在,我需要阅读大量的q和a来查找所需的内容。这对我来说不是很吸引人。直接在Google上搜索可为我提供更具可读性的结果。

–瓦伦丁·德斯帕(Valentin Despa)
13年1月8日在9:04

此更改大大降低了StackOverflow对我的用处。我必须以较低的对比度阅读更多的文本,以确定答案是否有用。顺便说一句,我创建了一个meta.so帐户,以便对此发表评论。对我来说很重要。

–CornPuff
2013年1月10日19:51



我也发现现在很难快速找到一些东西。默认的问题和答案混合得很糟糕,与旧的结果相比,结果的布局混乱。您只是被一堆文字打中。请重新考虑界面!

–宏伟
2013年1月10日23:30

我也同意搜索结果界面变得越来越差。这不是习惯问题,要找到有用的信息就更困难了。

–罗卡鲁斯(Rumulus Urakagi)蔡
2013年1月11日在2:57

我也必须同意;使用新的搜索结果界面还有几天的时间,我发现我无法尽快确定搜索提出的问题的相关性,尤其是当我正在寻找可能有答案的问题时。我发现自己使用StackOverflow LESS并首先依赖Google或Bing,然后勉强地进入StackOverflow在网站上进行搜索。结果呈现的方式并不像以前那样清晰。

– Sean Quinn
2013年1月11日14:06

查看当前结果,我们昨天从纽约移居休息了一段时间,并介绍了/ questions出现的方式更加一致。让我们知道您的想法。

–尼克·克拉弗♦
13年1月25日在18:13

@nick肯定好多了。我有点..讨厌..旧的“新”弹性搜索结果。特别是将Q和Q混合使用,因为列表中的不同项确实令人困惑,我们在SO早期就已经意识到了这一点,用户真的不喜欢它。

–杰夫·阿特伍德
13年2月1日,0:35

@JeffAtwood我同意将Q和As混合不会有帮助。它不仅使单个线程占用多个插槽并给我更多阅读空间,从而降低了紧凑性,而且如果在结果列表中阅读完某个问题后,如果我确定一个与我的需求无关的问题,我真的不在乎这个问题有什么答案。默认情况下绝对应该只显示问题。

– SpellingD
13年2月1日在17:24

#2 楼

谢谢,谢谢,谢谢您给我们提供默认的AND搜索。您确实做到了一个非常快乐的圣诞节。

评论


我会回答这个问题,因为我的回答基本上是相同的。

–uɐɯsOuɐɥʇɐN
2012-12-23 22:41

确实,这可以解决旧搜索引擎绝对排名第一的最坏问题。

–迈克尔·汉普顿
2012年12月23日在23:03

没有更多的加键。是免费的!是免费的

–本·布罗卡(Ben Brocka)
2012年12月23日在23:13

@BenBrocka-注意:+不再重要,尽管例如我们确实在+ [tag]上对其进行了解析,以便它“可以正常工作”并且不会发出抱怨……就像-[tag]那样,直观等等。

–尼克·克拉弗♦
2012-12-24在1:02



#3 楼

我只是搜索了“删除主持人的处理呼叫”帖子。

正常搜索(带引号或不带引号),然后按预期出现问题。

不带引号的新搜索,问题出现在第三位:



使用带引号的新搜索,结果甚至更糟,排在第九位:



我认为需要对标题完全匹配,不带引号的内容进行一些调整。我认为这涉及给标题更多的权重,但是这是解决方案还是对其他搜索产生的影响,请您解决。

评论


我认为,如果在结果中,答案是在其答案上方推广问题,这将是解决此问题的最佳方法。

–尼克·克拉弗♦
2012年12月24日,0:34

现在尝试一下此搜索,我已经更改了多地图字段与标题,正文和标签的关联方式。现在仅搜索标题中的问题,而正文和标签适用于所有帖子。我想您会发现标题搜索的结果通常要强得多...找到相反的示例,我将再看一下进一步完善它的方法。

–尼克·克拉弗♦
2012年12月24日,3:13

@NickCraver现在看起来不错。关于精确标题搜索的一个很好的方面是,您正在渲染的HTML中进行搜索,因此我看到了原始帖子以及搜索结果中的答案(我使用的是原始链接,而不是转换后的确切标题)。找到后,我将进行更多更新。谢谢。

–casperOne
2012-12-24在3:44



#4 楼

在搜索项中不再忽略诸如+,-和下划线之类的字符,这使诸如“ _meta”,“ c ++书籍”和“ c--”之类的搜索成为可能。

这是一个可喜的变化。非常感谢! \ o /

#5 楼

我们还需要在聊天中使用此功能(默认为AND,并且在没有速率限制的情况下进行更快的搜索)。我发现自己在TL中搜索了大量相关消息,并且要花很多时间才能到达。

评论


我们曾经考虑过Lucene.net可以更早地搜索聊天……这更有可能。在主网络上部署之后,我将与Ben和Marc一起了解如何实现这一目标。由于我们可以使用相同的集群,因此只需要编写代码。

–尼克·克拉弗♦
2012年12月23日在23:08

本周我们有很多待办事项,准备搬回纽约(在一个崭新的数据中心中!weee!),但我们将在今天开始计划。可能需要一两周的时间才能找到时间,但我们将使弹性的聊天搜索成为可能。

–尼克·克拉弗♦
2013年1月7日15:34

@NickCraver:很高兴知道您正在寻找这个:)

– Manishearth
13年7月7日在17:38

#6 楼

我在这里的其他地方看到了对此的引用,但是请,请考虑更改新搜索基础结构的行为,以默认使用is:question搜索修饰符。我认为搜索具有答案的问题比搜索具有问题的答案更有用。如果我知道我所遇到的问题的答案,那么我就不需要一开始就来到这里。我之所以来到Stack网站,是因为我对某个问题有疑问,我想知道其他人是否有相同(或相似)的问题以及对此的回答是什么。

评论


是的,请让我有点发疯,必须在所有查询中始终键入“ is:question”。

–雷切尔
13年1月15日在18:44

完全。这很烦人。默认情况下,单个问题的结果应合并。

–leonbloy
13年1月16日在20:56

我不同意。当我在寻找问题的解决方案时,常见的情况是提问者在调查中没有达到相同的目的,或者使用的术语不相同,因此我要搜索的关键字可能会出现在答案中但不是问题。我想搜索两种类型的帖子而不是仅搜索问题。使问题和答案在视觉上更具区别是很好的,并且在搜索结果页面上有一个按钮可以限制问题或答案,但不要仅将问题设为默认问题。

–吉尔斯'所以-不再是邪恶的'
2013年1月25日19:53

@Gilles我可以更好地从视觉上区分答案和问题。看来他们可能已经根据我最近看到的内容为此目的而努力了。

– Sean Quinn
13年1月27日在17:43

我当然希望我能得到一个奖励,我已经厌倦了打字:也是问题。

–兰斯·罗伯茨(Lance Roberts)
13年1月28日在14:07

只需键入是:q。它不能完全解决问题,但是可以减少烦人的事情。

–月桂树
16年6月7日在2:23

#7 楼

不知道是否排除术语是Lucene.net搜索的功能。


重复-duplicate




0个结果-老派

12,101热门-新口味


希望搜索会自行取消并且什么也不返回。

评论


我们从来没有真正做过排除,但是我认为通过一些解析器调整,我们可以做得很好...我将尝试明天实现我的想法。

–尼克·克拉弗♦
2012年12月26日23:11

现在已经部署了一个新版本,-term和-“ quoted statement”现在应该都可以正常工作了……如果您对其中之一感到疯狂,请告诉我。

–尼克·克拉弗♦
2012年12月27日12:00

#8 楼

我们可以进行评论搜索吗?遵循is:comment的操作员将是完美的。由于我们有指向注释的直接链接,而且显然还有呈现的注释文本,所以它将是一个非常有用的工具。

被允许,它可以扩展很多索引(索引可能必须以不同的方式工作因为我们可以从系统中删除评论,但这确实很有用。

举例来说,今天上午(在发布此信息时)的此功能请求以及功能要求以及Stack Overflow创始人之一的要求。

评论


特别是在meta中,其中很多讨论都在评论中进行,我认为这将是一个有用的补充。

–马特
2013年1月7日14:58



搜索索引实际上是从数据库中抓取帖子(我们不抓取HTML)...所以是的,这是完全不同的索引路径。话虽这么说,是的,新搜索在设计时考虑了诸如评论之类的更多内容,并且在我的TODO列表中。除非今天在我们的每周会议上提出不这样做的理由,否则我可能会在纽约恢复运行后再去讨论。

–尼克·克拉弗♦
2013年1月7日15:18

@NickCraver太好了!真高兴,谢谢。

–casperOne
2013年1月7日15:24

#9 楼

这样不好。一点都不好。

首先,如何使用旧的搜索引擎?我尝试了searchsearch-old。我当然希望对我的答案进行比较,但我也正在考虑永久回去。哎呀,我什至会付钱。至少Google在更改GMail中的撰写或Google Play中的开发者控制台时提供(永久)选择。

这种观点有两部分:

替换后台引擎:

我对旧的搜索引擎一点都不怀疑。没有性能问题,没有问题等待或重试,而且我真的不需要添加任何新功能。

我希望新引擎出现的唯一问题是它不会带来尽可能多的相关搜索结果。确实没有。搜索"android action bar custom box"仅给出5个结果,其中2个没有用android标记(这对于新引擎而言可能是一个加号,但是将其并入修复帖子的机器人中更好吗?)。没有结果标记为android-actionbar。也许他们是主题话题(实际上不是),但是这通常不是质量较低的未标记问题吗?

我觉得旧引擎至少会给我更多的结果,而这些结果只是基于在我的一部分关键字上作为用户,我会意识到这一点,并“识别”一条虚拟线路,在该线路上,旧引擎放弃了我的全部相关查询,而只添加了牵强的东西。这实际上会有所帮助,因为有时浏览最后一点会发现有用的见解,或者只是奇怪的关键字问题,这些问题仍然在异国搜索查询中很流行。因此,这对于旧引擎是一个加分。

对我而言,在SO上搜索的困难之处一直是带头解决真正相关的问题。 Android的API使用许多常用词作为术语。以单词"action views"为例。两者都很常见。然而,对于Android,它们非常具体地指的是动作视图,这些视图总共可能只包含20到50个问题。添加“ android”将无济于事,因为有成千上万的Android问题仍然包含常用词。如果新引擎允许更广泛的搜索,那么这根本无济于事。

当然,SE可能有充分的理由(服务器性能),在这种情况下,这是非常有效的观点。

更改搜索用户界面:

但是,为什么SE SE会更改成功的搜索界面,这是完全无法理解的。听起来像苹果地图。请看Tim Yi Jiang的答案中的屏幕截图。

我主要记得旧引擎的宽度有些受限制,也许有些发灰,但是在潜意识中还有很多颜色提示告诉我有关这个问题的一些信息。

与化身相同。让它们具有即时可识别性不是重点吗?那为什么不在搜索中显示它们呢?我认识一些人,当他们问一个问题时,您可以很好地确定这是一个需要提出的问题(以至于成为Android中的另一个bug)。

然后是文本块的问题。我现在所看到的基本上是两个文本块(一个标题,一个带有随机黑体字的乱码问题)。基本上,我发现我在心理上对现在代表他们的方式视而不见。我还感到标题下方显示的问题文本部分比以前稍长。

我认为突然更改搜索UI并将其与引擎更改结合起来是一个错误。

对不起,我意识到这不是您想要的听见,但这只是我的真实。

评论


在搜索时,我肯定根本不会错过这些gravatars。眼睛可以更快地扫描文本而不会受到阻碍

–随机
13年1月6日在22:17

Google可以让您抵御长时间的某些UI更改,但是更新他们的搜索算法时不会回滚。

–Shog9
13年1月8日,下午3:09

对,那是真的。

– pjv
13年1月8日在21:01

#10 楼

我没想到我会错过旧的“忍者”页面,但事实证明,我已经习惯了一件事,甚至根本没有考虑过:使用方便的Google自定义搜索框,必应和DuckDuckGo。

(当然,我的意思是Google)

键入“ site:stackoverflow.com”实际上并不需要付出更多的努力,但要付出更多的努力-当结果无法满足我的需要时,清除搜索框并敲击Enter键以达到该忍者页面的目的,将无法使内心满意。

#11 楼

我在meta上搜索了“ dont jsfiddle”,试图找到这个答案,但是我得到的唯一结果是:





相比之下,谷歌显示出更多的结果。即使搜索确切的短语“不仅仅包含指向jsFiddle的链接”,也不会显示结果。

搜索词包含在blockquote中;不知道这是否与它有关?

评论


好吧,在此答案之后,它现在有两个结果!不过,我会看看,感谢您的报告。

–尼克·克拉弗♦
13年1月5日,12:43

我已经找到了问题,在本示例中,该术语在标题和正文之间是分开的,并且“和”没有遍历两者。我将看一下查询构造,看看可能会在星期一做什么。

–尼克·克拉弗♦
2013年1月6日在1:21



@Nick相关:搜索会忽略最明显的结果(带有数十个传入链接的已提出问题)

– Pekka
13年2月3日,17:42



@Nick:发布上述评论时,您是否想到过一个特定的“星期一”? ;)

–马特
13年3月7日在20:18

@Matt meta.stackoverflow.com/search?q=don%27t+jsfiddle,该短语也适用

–尼克·克拉弗♦
13年3月7日在21:13

@NickCraver:嗯,这教我在(轻松地)讽刺之前先检查一下;)。我肯定在前一阵子检查过了,然后:P。还没有修复。

–马特
13年7月7日在21:15

#12 楼

搜索的功能似乎有点古怪。我在Arqade Meta上搜索了“广告”(以查找用来标记有关社区促销广告但未提及主题的问题的信息),虽然我确实获得了广告和广告的结果,但我也获得了“添加”的结果”,“添加”以及其他与广告无关的排列方式。这真的没有道理。

评论


我已经多次看到“ ad”被拼写为“ add”,以至于实际上这对我来说很有意义(尽管这当然不是原因;它是一个不真正了解这些知识的非自尊词干)。

– balpha
2013年1月9日17:08

#13 楼

似乎新的搜索无法处理以下问题:





不能正确阻止“无法”搜索框似乎会将其截断。

评论


但是:引用(如“句子”中)效果很好。看来,其他单引号也是如此,例如“不要”。

– Arjan
2013年1月10日20:30



无法解决的情况将在下一次部署中得到解决,这是我最初没有注意到的解析层错误……在下一次构建之后(可能在早晨)进行所有收缩后,结果要好得多。

–尼克·克拉弗♦
2013年3月1日在1:41

#14 楼

更新:此功能现已实现:-)


我们可以在标签搜索框中添加OR选项吗?

让我解释一下:如果我想搜索标记为[sql]或[mysql]的问题,然后我可以像这样进行搜索:https://stackoverflow.com/questions/tagged/sql+or+mysql

我们可以搜索多个标记(使用AND方法),例如[sql] [mysql] score:10。但是我们不能使用OR运算符来执行此操作:[sql] or [mysql] score:10

是否存在此功能?如果是:如何实现?如果没有:我们可以实施吗?请....

您可以在这里看到问题。

评论


希望可以用常规搜索词来完成彩色图像与彩色图像的不同。实现可以是[颜色或颜色]图像。你说什么?

–anki
19-10-18在17:28



#15 楼

难道是当使用非短语搜索时,停用词的移除非常激进吗?
搜索what is a codec只会在较差的位置9(即使在可见的滚动区域之外)也返回相关问题。
为什么它应该排在更好的位置:


相关问题的标题是“什么是编解码器(例如DivX?),它有什么不同……”。首先是“什么是编解码器”的字面匹配。


与其他问题相比,这是唯一得分最高的问题27。所有答案的总分是74。


第一个结果的得分为-2。嗯?


排名下降的原因似乎是停用词“ is”和“ a”被删除了,但是在问答中,这些词是否应该被认为更重要网站比普通的基于文档的搜索引擎?我希望用户在搜索框中输入很多实际问题。
至少我认为,如果存在字面匹配,我正在寻找的问题的排名会更好。
也许对此的解决方案也将更加重视标题和得分。但我不知道这会带来什么后果。

评论


标题通常不够好(总的来说)不能加权。停用词很棘手,因为它完全取决于它们是否有用的上下文,这是上次丢弃停用词时有用与较差之间的50/50比例。在AND的情况下,当它没有特别相关时,通常会留下不包含停用词的结果...因此,无关紧要的词会导致最佳结果根本不出现,而不是不在最前面。毫无疑问,这很棘手,当前的希望是,它比旧的搜索有所改进...但是我们绝不做得更好。

–尼克·克拉弗♦
13年1月4日在22:40

感谢您的评论。实际上,通过旧的搜索,即使没有使用标题过滤器,我也找不到问题,因此,这绝对是一个改进。尽管如此,做得好!

–slhck
13年1月4日在22:55

#16 楼

我很失望,每个问题的观看次数不再显示在搜索结果中。看到有多少人阅读了特定查询的结果,使我立即了解到对相关主题感兴趣的社区的规模。尽管投票数显然可以代替此类信息,但它是一种间接得多的方法。

更重要的是,问题视图的显示并不能使老式的搜索结果成为现实。一目了然。即使用例与您个人无关,您可以在搜索结果中显示的信息越多(而不会使它们变得更加令人困惑或难以理解),它们对网站用户的帮助就越大。正是这种信息的收集和深思熟虑才真正使Stack Overflow与更通用的编码论坛脱颖而出。

评论


如果我们显示视图,则由于各种技术原因它们将不准确。至少,它们必须准确才能显示出来(它们现在可能大相径庭)。第二点是它们必须有用,而在大多数情况下它们没有用。您正在要求使所有用户界面混乱的信息,因为使用它的用户很少……我们在决定显示内容时必须权衡这些折衷。我并不是说这是一成不变的,但目前,我们在此方面遇到了一些技术障碍-随着时间的流逝,解决方案将会来临。

–尼克·克拉弗♦
2013年1月6日,1:11

#17 楼

在去年发布的帖子(现在已删除)中,升级了搜索系统后,您摆脱了infavorites:搜索运算符。对于标记为延迟状态的标记,仍然有一个功能请求。

您是否可以使用新的Elasticsearch引擎重新实现该运算符?

评论


现在实际上在那儿,我将其标记为[状态完成]。它用作不喜欢的:我的和不喜欢的:。我只是忘了将它添加到高级搜索帮助中……明天将得到它。

–尼克·克拉弗♦
13年1月6日在22:17

您可能需要将其更改为infavorites:me以匹配现有的self语法。

–兰斯·罗伯茨(Lance Roberts)
13年1月6日在22:17

它根本听不清,所以我们选择了“我的” ...说我们将做广告“我的”,但也要使“我”工作。布尔值也是如此,除了1/0,“ yes”和“ no”也起作用。

–尼克·克拉弗♦
13年1月6日在22:19

那么我以前做过的工作会不会进行?

–兰斯·罗伯茨(Lance Roberts)
13年1月6日在22:19

是的,为什么?-无需让它们有所不同。

–尼克·克拉弗♦
13年1月6日在22:20

太好了,我真的很喜欢用户界面中的一致性。

–兰斯·罗伯茨(Lance Roberts)
13年1月6日在22:21

我在您的问题中看到两个单独的请求...引擎中最老的问题是什么:这是您最喜欢的问题,而不是标签。我们可能会在以后添加标签,但现在还没有(我必须对这种更改进行性能测试,标签的工作方式会更加昂贵)。

–尼克·克拉弗♦
2013年1月6日22:27

@Nick,您是对的,我感到困惑,让我知道mytags中的情况如何。

–兰斯·罗伯茨(Lance Roberts)
13年1月6日在22:28



#18 楼

这是来自UX的一个奇怪的问题:搜索引擎中的错误-搜索引擎为什么找不到该页面?

用户正在寻找有关此错误警报现象的名称或数据?却无法通过搜索字词名称提醒找到它(我也找不到它,只有17个结果!)。不知道是因为单词是标题还是标题,但是Q似乎应该是该Q的主要结果

#19 楼

可能的错误:

我不知道这是否是故意的,但我正在寻找我当天早些时候读过的标题为How to debug System.StackOverflowException without link to source code?的问题。

我尝试了几次搜索,并按最新顺序进行了排序,因为它是在当天早上创建的,因此找不到。搜索的对象是StackOverflowExceptionStackOverflowException source code,可能还有其他几个。

问题是分析器将单词中的.视为令牌的一部分,而不是将其视为单词边界。当按最新问题排序时,搜索System.StackOverflowException使其成为最优先的结果。

功能建议:

我发现我的第一个错误是试图仅搜索StackOverflow和不是StackOverflowException,这让我想到了这个主意。似乎许多搜索引擎在分析文本以进行索引时都会做这件事。

将驼峰化的词都标记为原始词(即StackOverflowException)和每个子词(stackoverflowexception)。为了帮助平均搜索,您可以对子词应用分数提升,以使这些匹配不会轻易超过匹配原始搜索词的文档。

评论


看来您是在引用搜索字词,对不对?同时,这也被报道为独立文章:不要因为标点符号而排除结果。 (因此,不将其嵌入引号中不会带来上述问题。)

– Arjan
2013年1月27日7:19



@Arjan-我都尝试过。我对Lucene的工作方式非常熟悉,因此尝试两种方式都是一种本能。 -同样的结果。我不确定问题是否仍然存在。不幸的是,我的示例不再起作用,因为StackOverflowException术语现在在答案上了(不确定此时是否正在解决问题)

–克里斯托弗·柯伦斯(Christopher Currens)
2013年1月27日7:59



您可能会遇到帖子本身也存在错误消息引号的问题……(我在上面链接的错误报告中添加了一些示例。)

– Arjan
2013年1月27日9:00

@Arjan-不幸的是,事实并非如此。实际上,在您的图片中,该问题的答案左侧已链接,您可以看到我将第二个问题作为第三个结果。注意标题没有引号,而主体确实有单引号。

–克里斯托弗·柯伦斯(Christopher Currens)
13年1月27日在9:56

#20 楼

代码搜索更好。



新方法:代码运算符“ Code:GetType”:373


旧方法:代码运算符代码:“ GetType” 265


新方法拾取具有不同大小写(预期)的内容,并拾取旧方法未能拾取应放在代码块中的内容,例如


尝试使用与Silverlight应用程序进行通信的wcf从dll类获取属性

并且由于它不区分大小写,因此不会出现此问题。

评论


谢谢,代码搜索将在下一个版本中正常运行-尽管我需要下拉索引以修复已删除的所有者在周末显示在结果中。

–尼克·克拉弗♦
2012-12-28 23:15

昨晚新版本发布了,代码:“ GetType”搜索现在可以找到373个结果,全部在代码块内。

–尼克·克拉弗♦
2012年12月29日9:57

不错,看起来不错

–一些有用的评论者
2012年12月29日17:16

#21 楼

很有可能是设计使然,但是要确保:对预格式化代码块的搜索结果摘要不带换行符。这可能看起来很有趣,但可能仅当code被滥用以进行格式化时:



#22 楼

我试图找到这篇文章;如何使用“不关闭投票”选项来抵消“不关闭投票”?通过搜索“不关闭投票”。

但是,结果不会显示在首页的任何位置;即使这是直接的词组匹配。

现在当然可以搜索确切的词组,但是在搜索时,我不知道自己正在使用精确的词组进行搜索。

此外,精确短语搜索中的“最佳”结果(IMO)被一个不相关问题的劣质2票答案所取代。

评论


... -1有什么特殊原因吗?

–马特
13年3月19日在11:52

马特,我想-1是由一个不屑于阅读问题中明确指出的人给出的:“我们期待反馈。”

– gna
13年3月19日在13:11

#23 楼

让我再举一个例子:

当我在查询中使用新的查询“ DialogFragment上的Theme.Holo.Dialog”时,我得到两个非常平庸的结果。

当我使用在Google上进行相同的查询,我得到了更多的结果,包括来自SO的结果。而且,第三个结果几乎就是我想要的结果,而这正是从这里来的!

所以我怎么再也没有这些出色的搜索结果了?

评论


Google结果没有“ Theme.Holo.Dialog”,而是“ Theme.Holo.Light.Dialog”。基本上,Google对x.y.z的搜索与对x y z的搜索类似,但此处将其保留为一个单词(这对我来说很有意义,但确实会限制结果)。

–user154510
2013年1月9日17:35

这不是搜索的基本思想吗?那不是要从字面上接受您的搜索查询并匹配它,而是要查找相似的匹配项?无论如何,如果有人可以告诉我旧引擎会给我带来什么,也许我可以放心。

– pjv
2013年1月10日17:29

@pjv-旧引擎也找不到。并不是说我们不在乎...我正在收集这些示例,并看到我们可以做些什么来改善整个搜索范围。搜索绝不是最终结果,我们会在时间允许的情况下继续改善搜索结果。我在这里一直很安静,因为我们将要移动一半以上的服务器,并且还有很多准备工作……尽管我们正在倾听!

–尼克·克拉弗♦
2013年1月11日14:21

感谢您的信号。

– pjv
2013年1月11日在21:58

#24 楼

问题和答案在搜索结果中的显示方式似乎不一致-有时您会看到问号:,有时却看不到。我看不出为什么某些结果缺少问题文本的任何原因,这是我在扫描结果时要寻找的主要内容。例如,在SO中搜索“ C#自动类型推断” ”在下面包括选择的问题-为什么仅在前两个问题中包含问题文本?



评论


新的搜索将返回答案和问题。这里的后两个匹配答案,但不匹配问题

–随机
13年1月18日在22:10

@random-有趣的是,我没有意识到这完全是Q:或A:而且从来没有。不过,我还是希望在结果中看到问题文本,而不仅仅是答案...虽然我想知道那是因为那是我对旧搜索结果的习惯,还是因为我真的更喜欢看原始内容试图确定匹配结果是否与我遇到的问题类似的人的问题。老实说我不知道​​。

–德里克
13年1月18日在22:21

#25 楼


需要做什么:“您告诉我们的内容已被破坏...”


在我们主要站点上搜索所有站点时,例如:“每页搜索结果数”,每页返回四个结果;并且在该搜索的情况下显示为:“大约86,100个结果(0.38秒)”。

Google具有“用户设置”,但是如果选择了“每页结果”在第一个返回的搜索页面上。我每页可以处理4个以上的结果,为什么这么少?甚至10-20也会好得多。默认值太低。例如,Google拥有以下内容:


在移动设备上,您必须放大以点击其中一个小数字[ 1 2 3 4 ...]进入下一页,甚至没有[Prev] [Next]链接。例如,Google拥有以下内容:

    « Prev  1   2   3   4   5   Next »


感谢您考虑此请求。