2013/03/06更新:我一直在Data Explorer中玩耍(我第一次使用它),并整理了一个基本查询,以帮助更好地识别与错字相关的帖子,欢迎改进:
http://data.stackexchange.com/stackoverflow/query/edit/101573
select a.Id as [Post Link], a.Body
from Posts q
inner join Posts a on a.Id = q.AcceptedAnswerId -- only check accepted answers
where len(a.Body) < 200 -- posts less than 200 chars can be a giveaway
and q.ClosedDate IS NULL -- only search open questions
and (
lower(a.Body) like '%typo%'
or lower(a.Body) like '%spelled wrong%'
or lower(a.Body) like '%spelled incorrectly%' -- add more...
)
通过这种简单的搜索,产生了大量与打字错误有关的“过于本地化”的问题OP:
https://stackoverflow.com/search?q=body%3Atypo+is%3Aanswer+isaccepted%3Ayes
此查询有很多活动,所以我怀疑剩下要做的大部分工作都在您对问题进行排序的“中间”位置。有几种不符合条件,坏的被删除的越多,就越难找到更多。
这些是:
https:// stackoverflow .com / search?q = body%3Aspelled +错误+ is%3Aanswer + isaccepted%3Ayes
https://stackoverflow.com/search?q=body%3Aspelt+错误+ is%3Aanswer + isaccepted%3Ayes
https://stackoverflow.com/search?q=body%3Aspelled+incorrectly+is%3Aanswer+isaccepted%3Ayes
https://stackoverflow.com/search?q=body%3Aspelt+incorrectly+ is%3Aanswer + isaccepted%3Ayes
这些非常简单,几乎所有这些都是“过于本地化”的明确案例。我敢肯定,这个查询还有更多的变体,我想都没想到。
大多数已接受的答案是这样的:
✓ “
passwrod
”应为“ password
”。OMG您好!!!我觉得很蠢! – CarelessUser's May 10 '11 at 13:03
主持人可以直接进入并开始直接删除它们,甚至可能很糟糕,但我意识到这些mod非常忙(到目前为止据我了解,由于某些mod永久性地被删除,因此他们不愿意参与其中。
我们如何提供帮助?
大家都愿意通过关闭并删除这些问题来帮助我清理这些问题吗?几乎所有人都是过于局限的无用问题的案例。有很多,这就是为什么我要寻求帮助。我会在业余时间竭尽所能。
我刚开始做的一件事似乎有所帮助。每当我看到有3K +用户回答以下问题之一时,就会发布此评论:
There's a [campaign to clean up Stack Overflow](https://meta.stackexchange.com/q/167342) by removing these typo-related questions - we could really use your help! Would you mind pitching in a little by casting a close vote on this question?
因此,如果您由于类似的评论而正在阅读此内容,谢谢!
如果您还没有的话,请加入我们的聊天室! 。我定位的帖子(严格来说是与打字错误有关)通常需要2秒钟左右才能断定它们无用,我认为这很容易清除。当然,如果问题/答案具有与错字无关的其他相关内容,则可能不适合删除。
如果您具有“删除”特权,请使用它们。一旦问题开始消失,这将使过程变得更加容易。
不要标记,因为这会使mods变得更多工作,请简单地投票。 br />
注释中的好问题:有什么方法可以从列表中过滤掉已关闭的问题?该查询搜索答案的事实阻止了使用
closed:no
。如果您有疑问,请在这种情况下将其保持打开状态。但是,如果您发现拼写错误已在原始资源中修复,请继续并关闭问题,因为它不再适用。#1 楼
SE聊天室可帮助协调投票
现在,由Gordon,David X.Random和PeeHaa提供实时积压工作,
语法指出您认为应该关闭的问题:
[tag:cv-pls] (url)
似乎很难协调对此的表决;我们似乎需要一个工具。 (Google文档确实更像拐杖)
PHP聊天室具有自动关闭投票工具。它的工作方式如下(AFAIK):
有人在聊天中发布了一个问题的链接并标记了它。尚未关闭的待办事项。
它们甚至具有浏览器加载项。
我不知道这是否也可以用于此目的?当然,在单独的聊天室中。
我想这取决于设置不同的聊天室ID并使用其自己的待办事项列表的整个cv-ring系统副本的难易程度。 (在@Gordon和@DaveRandom的方向上纯洁地瞥了一眼)
评论
选票的协调在这里绝对有帮助。也许我们可以一起使用同一标签,或者每天使用一个标签?有人可以宣布当天的焦点,然后将其发布到某处。
– KatieK
13年2月28日在19:43
CV-Backlog当前不针对特定的聊天室。我认为没有必要这样做,因为我们是唯一使用这些cv-pls标签的人。因此,当前它将从所有聊天中获取标记的链接。如果你们想要自己的积压,可以尝试在heroku上安装。限制为特定的聊天需要将房间参数添加到Webpage类。但是,为什么不共同使用积压呢?
–戈登
13年2月28日在21:42
@Gordon因此,当前它将在所有聊天中获取标记的链接。嘿,太酷了!联合待办事项将完全起作用,但有一个缺点:参与此活动的人们无法区分特定于PHP的结束候选人(他们不一定具有结束投票的专业知识)。如果有机会,我可能会尝试在接下来的几天中使积压工作正常进行
– Pekka
13年2月28日在21:50
否则,如果他们不确定或不同意,他们就不能对他们投票。我们也是这样做的。
–戈登
13年2月28日在22:11
@戈登是的。设置聊天室chat.stackoverflow.com/rooms/25318/the-closing-room
– Pekka
13年2月28日在22:22
作为记录,PeeHaa帮了我们忙,列出了聊天室的待办事项列表。而且,顺便说一句,您又得到了我的另一项密切投票,以备不时之需!
–亚历山大
13年2月28日在22:53
@Wesley是的!我有同感。多亏了来自PHP chat的人,他们为此构建了工具
– Pekka
13年1月1日在10:50
计划在本周末/尽可能早的时候为cv-ring系统安装一些猴子补丁。浏览器扩展会自动更新,因此,如果您现在要开始使用,将尽快提供新功能。问题追踪器在这里。
– David X. Random
13年1月1日在16:38
#2 楼
很好为了不增加主持人溺水,不挥手的困扰,如果您的级别仅为举报,请勿这样做。
有很多拥有密切投票代表的用户,可以帮助清除这些碎片。 。
错别字与逻辑问题并不相同,当您清楚地发现后者时,看到前者的结果确实是一个麻烦的循环。
#3 楼
真是个好主意!我希望看到“这是拼写错误”问题得到了解决。当然,当他们被问到时,他们没有内在的错,但是一旦解决,他们甚至不能再真正地帮助OP,更不用说任何未来的读者了。它们是搜寻的红鲱鱼,是一种不幸的问题症状轮,在SO上没有持久的位置。详细介绍关于审核的第一个项目符号):该列表中的某些答案偶然使用了“ typo”一词,或者提及了一些不是核心问题的内容:将两个shell命令合并到一个输出中shell和用于获取url参数的正则表达式是我刚遇到的两个。遇到它们以将其从搜索中删除时,我正在对其进行适当的编辑。 (无法编辑的一个是隐藏显示类功能的工具栏,该工具栏指的是IDE中菜单项的标题。)
我遇到了一些问题,这些问题涉及可能出现的替代答案:https://stackoverflow.com/q/4805619和https://stackoverflow.com/q/9612878是示例。我没有领域知识来决定这些答案本身是否有用,或者它们是否代表对问题中提出的问题的有效解决方案。我建议在这里谨慎;尽力确定是否应该保留该问题,以作为保留该答案的一种方式。答案终究会出现在搜索结果中。
我还看到有两个错字不是由OP生成的,而是来自教程或文档的:https://stackoverflow.com/q/11730071和https://stackoverflow.com/q/10535330。我投票关闭了第二个代码,因为在链接页面上找不到列出的代码。不过,总的来说,我会说如果错别字是来自外部来源,并且仍然存在,那么其他人很可能最终会遇到相同的问题-“这是错的吗?” -这对SO来说似乎是完全合理的事情。
代表们,请四舍五入!从列表末尾开始工作的好主意(即最早的帖子)?我意识到我的近票已经过期,部分原因是,在默认的“相关性”排序中,较新的帖子似乎首先出现。每当有人通过您的搜索链接时,某些具有现有好评的问题将被埋在第二页或第三页上。不幸的是,我无法知道该链接转到“最后一个”页面-只有数字似乎起作用。
从最后一页按“最新”排序的工作很尴尬,当然可以,但是我认为这可能会集中于这支全副武装和作战的力量。对不起,我们要集中精力并提高其效力。
处理这种协调的建议是欢迎不仅被提出,而且由独特的Pekka实现。
评论
我认为您对分类是正确的,我不知道如何在这一点上让所有人切换齿轮。有什么建议吗?随时编辑原始帖子并添加有关排序的通知(我完全错过了您的答案编辑)。我一直在为此努力工作,而且用光了。
–user159834
13年2月28日在15:48
除了您更改问题中指向stackoverflow.com/…的链接(转到“最新”标签,即)之外,我没有什么好主意@Wesley。我只是看了最后一页,其中很多不是我们要关注的问题。我们只是保持在此时出现的新功能之上。如果没有更多的可见性,除了通过标记,我不知道该如何实现,这无济于事,只能消磨一周左右,希望其他人加入。
–jscs
13年2月28日在21:07
#4 楼
我很幸运地使用以下方法来查找错字问题:“这是错字”错别字“
”您有错字“(虽然不是自动回答,仍是本地化的。截至编辑时,共有831个)
如果我们有十到十五个人来研究那些错字短语,应该敲掉几百个。
添加了2/27/13
“我忘记了”(4,782回答,这应该让人们忙一会儿)
评论
1,365个错过分号的答案结果
–本·布罗卡(Ben Brocka)
2013年2月25日在17:52
是的,“我有错字”很可能是OP的自回答,但有时是一些不必要的废话,例如“编辑:我有错字,已修正”。在一个真实问题的有效答案下面。
–user159834
2013年2月25日在18:12
@BenBrocka您忘记了报价。添加后,只剩下24个帖子:stackoverflow.com/search?q=%22missed+a+分号%22 + is%3Aa
– Rob W
13年3月2日在15:43
@RobW是的,但这阻止了词干和句子结构,在第一个查询中忽略了大量非常相关的结果。
–本·布罗卡(Ben Brocka)
13年3月2日在17:35
其他变体:“遗漏的[a]括号”,“遗忘的[a]括号”,“遗漏的[a]括号”,“遗忘的[a]括号”等。
–亚伦·伯特兰(Aaron Bertrand)
13年4月14日在16:23
#5 楼
图片©Allie Brosch。经临时许可使用。
评论
我想知道什么时候有人要张贴
– LittleBobbyTables-互惠生
2013年3月1日14:31
@TriG OP本身没有随附,这是来源。
–影子向导正在接种疫苗
13年6月3日于13:50
是的,@ ShaWizDowArd。我知道这是一个非常常用的图像,很少将其适当地归因于艾莉。但是她确实在“常见问题解答”页面上非常清楚地表明,她仍然拥有版权并希望注明出处。至少在SE上,如果没有其他地方,则应正确处理。
– TRiG
2013年6月3日14:56
@TRiG同意,但这只是沧海一粟。
–影子向导正在接种疫苗
2013年6月3日15:00
#6 楼
我没有足够的代表投票关闭:我标记需要标记的标记,但是我不会为此而烦恼。我想拥有closevote特权的人也可以继续。评论
造成的问题包括:搜索结果中的垃圾,寻找合法问题答案的人们的红鲱鱼。
–user159834
13年2月12日在23:27
妖精好点子。我仍然不会这样做:这不值得mod花费时间。但是你们中那些可以投票的人也可能会继续前进。
– TRiG
13年2月12日在23:29
我猜对这个答案的评论后面有一个忍者编辑;我喜欢这个答案。
–安德鲁·巴伯(Andrew Barber)
13年2月13日在0:26
@AndrewBarber:是的,原始帖子提到这些帖子不会引起任何问题。我必须自己编辑忍者,才能删除自己的下注。
–user159834
13年2月13日在0:27
没意识到我的编辑不会显示在修订历史记录中。我一定太快了。 (我对所有内容都发表了评论。)
– TRiG
13年2月13日在0:56
@TRiG如果您在发布问题/答案的2-5分钟(或类似的时间)之内进行编辑,则您的编辑将不会显示在修订历史记录中。
–ɥʇǝS
13年2月28日在1:29
#7 楼
当我通过过滤一段时间以“太本地化”来处理审阅队列时(现在我切换到“非主题”),我意识到我必须打开实际问题多少次才能看到当前的最佳答案实际上是“嘿,你打错了”。在至少具有至少一个“太本地化”标志的问题上,让紧密投票队列显示最佳答案将对解决这些问题非常有帮助。另一方面,紧密投票队列是每周变得越来越大...
#8 楼
这里有一条细线。我们是否要通过删除新用户在看到答案之前的问题来驱走他们?我们是否要通过剥夺自己的观点来惩罚回答这些问题的人?是否有人量化了由于遗忘了这些东西而人们绊倒了多少噪音?不是多少钱,而是多少钱会对搜索结果产生影响等。我认为这类问题所产生的负面影响足以将其推到桶的底部。
将干草叉放在有人的手,他们很难不加入暴徒。
评论
但是,如果我输入相同的错字怎么办?那么它非常有用!注意:此问题可能不是重复的问题。这个问题问他们是否应该关闭。在此基础上,这个问题正在尝试发起一项运动,以使他们关闭。
有什么方法可以从该列表中过滤出已关闭的问题?他们是答案的事实使我无法使用closed:no`
哦,所以您的观点是,因为有不为零的用户离开,我们作为社区失败了吗?我认为您的论点是,我们获得的新用户数量正在减少(因为我们变得更加敌对了)。这不是真的。
讨论进行了。这个问题是骗人的。总结:社区希望清理这些帖子,过于本地化的“展示”需要一些爱,例如收到的封闭式重复展示,以便更好地向新手传达问题所在。继续! meta.stackexchange.com/questions/123741/…
完全是@韦斯利。我们真是混蛋-这些天来,关于SO的一些关闭和评论简直令人震惊,而我常常不愿意再派人到这里来。但是,当社区实际上正在寻找清理某件事的时候,这并不能给它带来任何帮助,因为当社区消失时,没人会为之哭泣。海事组织。
就个人而言,我很高兴新用户在打字错误方面得到了帮助。我每周都会自己回答几个。但是,当他们的问题解决之后,这些问题就不必保留了。
似乎我们对此已经精疲力尽;我对这些问题的一些接近投票已经过期。
@JoshCaswell如果拥有insta-close / delete权限的人可能需要10分钟来查看这些内容,那就太好了。我对公开投票的到期时间不熟悉,他们需要多长时间才能到期?这似乎真的很快,我甚至在2周前才发布了此消息-您确定它们很快就会过期吗?
当问题的观看次数大于等于100时,所有最后的投票将在最后一轮投票后四天到期。 meta.stackexchange.com/a/97581/159251
@JoshCaswell-感谢您的赏金,我忘记了这一点!搜索“这是一个错字”一直给我很好的结果。
@JoshCaswell四天? IMO太快了。难怪关闭投票复审队列永远困扰着5万个问题...哇,它们都到期了,这是否还会阻止您稍后再次投票?
@Jack尽管使用临时标签可能很诱人,但这通常是一个坏主意,肯定有人会看到它以自动完成方式弹出并使用它导致级联,然后您不知道又是什么。
我创建了一个共享的Google文档来帮助协调投票工作:goo.gl/6vkPb如果人们认为这很值得,我们可以将其添加到问题中
为什么要删除3k +用户参与的标准注释文本?