t-sql
时,经常将Transact SQL问题标记为tsql
。但是,无论您多么努力地教育用户“正确”标记是
tsql
,您还是总是会得到带有错误标签的海报(t-sql
)。 显然,并非所有人都注意到或理解自动完成标签文本框中标签名称旁边的数字。同样,如果这是第一次使用标签(例如,在编辑人员进行了每日清理工作以正确重新标记这些标签之后),则系统不会提示用户考虑他们将要使用的标签。
对于
t-sql
和tsql
或active-directory
和activedirectory
这样的明显情况,也许最好实施一个标记同义词系统?*更新:已实现*
转到此处获取官方存储库:
标记同义词的官方存储库
#1 楼
我相信SO上的标签应该相对固定。通常,在标记不容易被索引的图像,音频或视频之类的媒体时,您需要一个非常宽松的标记结构,以鼓励添加尽可能多的变量。这是因为您严重依赖标签来索引要搜索的内容。这就是为什么flickr和youtube可以让您以任何想要的方式标记事物的原因。
但是,当谈论已经很容易被索引的文本时,标签本身对于索引并没有关系。您直接将文本编入索引。标签并不重要。那就是标题的工作。而是将标签严格用于分类。分类完全是另一回事,并且只有在每个人都将内容分类到同一类别中时,分类才有效。为此,您需要一组严格的类别。这就是为什么gmail标签(实际上是标签)很难仅凭空创建。
StackOverflow内容绝对是基于文本的,这意味着我们应该考虑使用严格的标签类别,而不是宽松的标签云。我建议对标记系统进行一些更改以帮助改进功能:
done创建新标记所需的最低重复阈值(实施为100,我希望看到它增加到250个,这样一个急切的新用户就必须在网站上花费至少一天以上的时间才能创建新标签)。
使用少于10个其他问题时出现的标记时,请添加警告。
限制某些垃圾词,例如'and','the','a','server' (在stackoverflow上),“视觉”等完全用作标记。甚至可能在可能的情况下静默地执行此操作-发布后标签不会显示。
每小时已经自动跟踪并更正了一些同义词。应该在发布和编辑问题时进行此操作。这样,用户更有可能注意到标签已更改(通常在更正之前解决了整个问题,因此用户永远都不知道它),并且我们减少了社区成员纠正这些标签所花费的时间,这些时间可以在其他地方花费更多。这一点也很重要,因为到了应用校正时,问题已经不在主页上了,而对基于校正后的标签的问题感兴趣的用户将永远看不到它。
完成用户提名一种用于合并/消除/添加到站点用户界面中内置的同义词列表的标签的方法(不仅仅是在此处发布问题),允许高级用户通过10K工具对提名进行评论和投票。
将'tags'重命名为'labels'ala GMail,以鼓励用户从分类的角度来考虑它们。
评论
标签搜索会自动将“ tsql”更改为“ t-sql”吗?发行这些同义词可能是一个主意,以使编辑知道并且不花时间在它们上?
–凯夫
2009年7月6日14:50
问题被重新标记,因此旧标签被完全删除,新标签被添加。仅跟踪某些已知的同义词,并且没有全面的列表可提供给用户使用哪些标记。
–乔尔·科恩(Joel Coehoorn)
09年7月6日在14:54
创建一个请重新标记的标签也将非常不错
–史蒂夫·施内普(Steve Schnepp)
09年7月6日在15:34
+1好主意,这将以许多不同的方式有所帮助!
–亚历山大·安加斯(Alex Angas)
09年7月6日在16:05
还有一个问题,主要是到正确标记它时,它已经错过了首页和rss feed,因此,许多合格的回答者都不会看到它。
–乔尔·科恩(Joel Coehoorn)
09年7月6日在16:09
Steve Schnepp建议的标签实际上称为[retag-request]
–布拉德·吉尔伯特(Brad Gilbert)
09年7月29日在4:30
我坚决同意发布同义词列表和/或提名新条目的简便方法。
–醚
09年8月16日在0:52
+1用于限制垃圾单词;目前在SO上有1000多个标记为“文件”的问题。
– wcoenen
2010年1月11日15:14
对此的另一个需求是IBM营销部门关于AS / 400的MPD,该商标已被冠以连续AS / 400,iSeries,SystemI和i5的商标,其O / S可以是OS / 400或i5 / OS。与Sun更改Java版本格式相比,他们更改AS / 400品牌的频率更高。
–劳伦斯·多尔(Lawrence Dol)
10 Mar 10 '10 at 7:31
好东西。对于如果标签具有<10个实例的警告,我建议使用100更好,它会大大减少标记错误的问题。同样,以某种方式阻止用户输入标签(好像它们是5个单词的句子)也是一种不错的方法。
–skaffman
2010-3-25在20:15
对标记同义词/黑名单进行投票将是迈向10k的一个非常好的垫脚石。也许可以做到6k rep?
–埃尔兹
2010-4-29在22:10
完成了“完全限制某些垃圾单词用作标记。”。当前列表为|或|和| the | a |
–杰夫·阿特伍德
2010年8月1日在18:47
#2 楼
我也想在标签用户界面中看到一些反建议。例如,每当有人输入“ mssql”时,我都希望看到他们建议使用“ sql-server”的替代方法。可能还建议他们也添加特定于版本的标记之一,例如“ sql-server-2008”。评论
我希望看到一个提示,每当用户选择“ sql”时,建议“ sql-server”,除非他们确实在问与DBMS无关的ANSI标准问题。
– APC
2010年5月2日15:15
#3 楼
我们有一个用于标记同义词的基本系统。您可以在
http://##site_url##/tags/synonyms
上查看每个站点的所有同义词,例如,这是meta的列表。它显示系统中所有同义词的转储以及名称。创建它的人和点击数。命中计数大约是同义词被调用的次数。
另外,在标签信息页面中,您现在可以投票并建议标签同义词。
例如,如果您尝试在meta上将标签标记为
waffle
,则标签将透明地更改为waffles
。没有最终用户界面,它只是在后台静默发生。 这个概念只是具有无争议的标签同义词,因此最终用户将不会因自动更改而烦恼。
如果您认为我们在网站上需要任何特定的同义词,请将问题发布到Meta上,以便集体讨论和投票。
评论
!!现在,让我们填充这些列表! meta.stackexchange.com/questions/50088/…
–马克·亨德森(Mark Henderson)
10年7月14日在5:53
非常感谢!!! :)
– Maxim Maxim Zaslavsky
2010年7月14日,下午5:56
标签页面会以某种方式链接到同义词页面吗?
– Maxim Maxim Zaslavsky
2010年7月14日在5:57
@Maxim,不是最初的,但是在某些时候,我们正在考虑将每个标签的Wiki页面同义词完全适合...
–华夫饼
2010年7月14日在6:02
所有完成的重新标记请求都将成为同义词列表的候选者。
– sth
2010年7月14日在12:40
那是仅主持人功能吗?
–兰斯·罗伯茨(Lance Roberts)
2010年7月14日在19:48
@Lance,仅限yerp主持人
–华夫饼
2010年7月14日在22:15
该计划将在不久的将来对此进行一些投票
–华夫饼
2010年7月15日在4:16
#4 楼
我预想的工作方式主要是后端/高级用户更改,其中有一个主标记和与该主标记关联的一组同义词标记。公共系统中只会显示主标签
每当在标签文本框中输入同义词标签时,系统都会在提交时自动将其替换为主标签(如果自动替换了所有内容,请让用户审核更改,然后再次提交)。
在标签搜索中,如果输入了同义词,则自动建议/搜索应建议/显示主标签。所有同义词都将具有与主标签相同的权重(即,问题计数),因此可以进行部分单词匹配。
最好使有序标签组成为建议标签,例如,如果用户输入将“ sql server”插入到标签框中,自动提示应为
[sql-server]
。由于在某些情况下建议不适用,因此不需要用户遵守建议。一个好的标签黑名单将有助于解决此问题。分类学家徽章仅授予创建使用在主/同义词集中使用50个或更多问题的主标签的人。即,您无法通过创建一堆同义词来获得徽章,但是如果创建一个主标签并获得一堆与该主标签相关联的同义词,那么您将获得徽章。
将同义词放入系统中:
现在所有标签都将开始作为主标签
现有的主标签将通过投票转换为同义词标签,这将是一个新的5k特权。 Diamond mods可以撤消此转换,并任意重组主/同义词关系。
转换投票将类似于“闭幕投票”系统,不同之处在于包括否定投票:如果净得分达到+5(阈值待讨论),转换将继续进行。如果净分数达到-5,则删除同义词建议。每个用户只能对一个主/同义词对提议(+或-)投票一次,尽管我认为能够多次提议相同的主/同义词对是合理的。
UI将采用类似于10k工具页面的页面形式。将为主标签提供提议的同义词的层次结构列表-如果为1个主标签提议3个同义词,则将有一个容易的地方可以对所有同义词提议进行投票。该列表将按标签的受欢迎程度进行排序,这将使更多的注意力放在最重要/受欢迎的标签上。
建议的同义词标签可以是现有的主标签,也可以是纯文本输入。我们希望能够将同义词放入系统中,即使还没有与之相关的任何问题(即预防性同义词)。提议中涉及的主标签将始终必须存在。
提议同义词的方式有两种:(a)在工具页面上列出的主标签中添加同义词,或(b)启动新标签。通过选择两个标签来选择主/同义词提议。问题计数将与每个提议的同义词标记一起显示,以显示用法(以及提议的同义词是否具有预防性)。
我不认为这种情况会经常发生,但它可能会发生:如果重新标记一堆问题远离提案中涉及的主标签,以便该主标签现在具有0个与之相关的问题,系统应锁定该提案系统/对该主标签进行投票,并标记以引起关注(在此位置他们可以重新组织master / synonym关系,以便master标签将存在现有问题。)
评论
这是一个结构合理的想法。它类似于成功的标签同义词系统,但在扩展方面还包括诸如如何处理预防性同义词和提出它们的方法之类的东西,尤其是标签组合不是强制性的而是建议使用的(仍然无助于人们忽视它的情况,但其效果要比强制实施更好。
–恩典♦
2010年5月14日14:39
就我个人而言,我都是为了拿走无效的分类学家徽章,但是我认为应该分开提出,我们的系统中已经有很多无效的徽章,并且杰夫总是说我们不拿走徽章。
–华夫饼
2010年7月12日,下午3:11
@waffles:我既不赞成也不反对拿走分类学家的徽章(这是杰夫已经做出的一项管理决定)。我在这里所说的只是将来如何修改系统以授予徽章。
–乔恩·西格尔(Jon Seigel)
2010年7月12日在3:19
状态完成:)
–华夫饼
2010年7月22日在6:43
@waffles:+十亿亿
–乔恩·西格尔(Jon Seigel)
2010年7月22日在17:08
#5 楼
标签建议最近得到了改进,以忽略连字符,因此键入t-s
仍建议tsql
。显然,有些人仍未发现更常用的标签,但希望它不会像以前那样糟糕。也许这些建议应该更加突出地突出显示仅在连字符之间不同的标签,如果它们使用的范围比用户尝试插入的标签更广泛(或者在提交时只是默默地更改它们)。评论
我认为您在任何具有仅连字符不同的标记的地方,都应将它们自动提名为消除标记的候选者(可能存在某些合法实例)。
–乔尔·科恩(Joel Coehoorn)
09年7月6日17:00
#6 楼
我同意你的看法。在serverfault上,也有很多双重功能。标签。另一件事是标签,可用于1件以上。像“屏幕”一样,它可以是GNU屏幕或类似于监视器的屏幕。对于这种情况,我认为标签“ screen”应该不可用,因为它的含义不止1个。
评论
它是“ vista”,而不是“ vita”(尽管使用该名称可能会是更好的操作系统……)
–Jason S
09年8月19日在1:37
#7 楼
这就是我谦虚地想象标签同义词起作用的方式:如果将“ visualisation”和“ visualization”定义为同义词,那么在标签字段中键入“ visualis”应将“ visualization”列为潜在标签,即使它不包含该字母序列。然后,您可以完全消除标记“ visualisation”(将所有现有条目迁移到z版本)。
已经通过简单地忽略连字符来涵盖了t-sql / tsql示例(在这里很好用! ),但此建议确实涵盖了答案中其他位置给出的“ mssql”与“ sql-server”示例。它甚至可以在两个标签都可能正确的情况下工作,但建议另一个仍然是个好主意。例如,sql人员可能会告诉我们,“ mssql”确实应该是有效的标签,但是当用户在标签字段中键入“ mssql”(或其中的一部分)时,仍应建议使用“ sql-server”。如果是这种情况,则键入“ sql-server”也应建议使用“ mssql”。这可以通过在同义词数据库表中具有反向条目(从sql-server到mssql)以及从mssql到sql-server版本来实现。
评论
感谢您的修改Æther-您能告诉我我对美国的拼写不熟悉吗?
–为什么
2010年1月4日,下午1:57
#8 楼
有人在“ t-sql”到“ tsql”等明显示例上重新标记的平均时间是否有任何经验数据?总是最好在尝试纠正已知问题之前先查看数据(实际上可能不是一个)。在我的书中,如果他们很快被重新标记,则系统运行正常。
#9 楼
也许应该有最低的信誉水平才能创建一个新标签(或使用当前具有0个用途的标签-即已创建但已合并到另一个标签中)?没有理由发问者必须自己完整地标记问题-代表较高的人很快就会看到并适当地标记它(如果尚未这样做的话)。
一个令人愉快的副作用是分类学家徽章较难游戏-至少,它可以避免游戏尝试,直到用户变得更老练且更明智为止。
编辑:我看到这里也建议这样做。
评论
当然,这已经实现,并且如果历史是我们的指导,那么这似乎是自然需要随着时间的流逝而提高的一个rep值。
–杰夫·阿特伍德
2010年7月14日在6:43
#10 楼
标记约定(根据SO的流行程度)是1230(支持tsql)和2(支持t-sql)。我在其他许多标记问题中都说过这一点,我认为约定应该是最受欢迎的格式(在这种情况下,显然是tsql)。标记同义词在过去也曾提出过,但我从未真正看到过任何使之有效地起作用的明智方法。
评论
我完全同意,但是您将拥有Canute King的生活,紧随出现的无穷无尽的T-SQL。因此,一个支持同义词的系统。允许用户以这种方式进行标记,但是当进行标记搜索时,如果有人搜索t-sql,他们也会得到tsql,因为它们的含义相同。
–凯夫
09年7月6日在16:08
@kev:或者我们可以首先保持数据正确。
–GEOCHET
09年7月6日在18:04
评论
我们也许还可以使用它来帮助我们的标签解决可用性问题。 meta.stackexchange.com/questions/27702/…缩写“ Transact-SQL”的正确方法是编写“ T-SQL”-您将永远无法教育用户实际上tsql是正确的标记。鉴于此,我不得不问,谁/这是什么问题?用户还是标签?
@Waffles OMG真的是刚刚实施的吗?
@Maxim是的...完成了...
@waffles-不错。