您在这里所做的不只是解决一个人的问题。
前一段时间,一个用户联系了我们有关其朋友帐户的信息。他的朋友曾经是我们网站上的头号用户,并且在其他两个网站上都很活跃,并不幸惨死。我们向他指出了针对这些情况的指导,但我们想让家人对他们所爱的人在这里付出的多少有所了解。令我们感到震惊的是,与以传统方式(如补习)捐赠时间的人不同,他的家人可能不知道通过帮助如此多的人寻找答案,用户对他们有积极的影响。
我很轻松能够证明他在短短两年内回答了400多个问题,并且他的大部分回答都被认为是最有用的。我可以尝试解释一下,他当时赚了将近两万代表。我可以告诉他们,这意味着他得到了大约两千张“赞成票”。问题在于所有这些事情都未能传达出重要的意义:
感谢这位用户,大量需要帮助的人很可能得到了帮助。进一步挖掘,我发现他的回答被浏览了超过590,000次,其中绝大多数来自人们寻求帮助的观点。这就是他在这里度过的时光的影响。
许多人在阅读本书时也是如此:您写的答案和分享的问题甚至使数百人受益。成千上万发现自己面临类似问题的人。这是Stack Exchange存在的根本原因-但是,系统中没有任何东西可以识别出这一点,也无法传达像您这样的个人在这里产生的乘法影响。
您必须得到这个才能得到我们。
我们为什么要关心人们是否了解可重复使用的内容在这里有多重要?对于现有用户,它可以为您在这里捐赠的时间真正产生的影响提供一些粗略的见解。在我在这里工作之前很久就吸引了我的一件事是,我在这里所做的努力将比埋在某个论坛中的人能提供的帮助更多。现在,如果您个人觉得帮助一个人既满意又能帮助一千个人,那也很好。也许您的动力是解决一个特别棘手的问题的挑战……这也很棒。引擎旨在使内容尽可能地可重用,因为它告知了我们系统的工作原理...
一旦您意识到它不仅仅涉及一个问询者或四个投票者,还涉及到一万五千个有相同问题的搜索者……嗯,突然间,一大堆似乎很刺眼和不重要的事情,例如删掉了“谢谢!”并不是要成为“一群权力快乐的学徒”,而是要帮助所有有这个问题的人找到最佳答案。并找到类似em的即时消息。
当前的工作方式(以及原因)。
我们最初的想法是捕获“有用帖子的大致视图”。这个概念是让您了解有多少人看到您的作品,并且很有机会发现它有用。它不能替代信誉,也不能授予系统内的任何其他特权(如代表所做的那样)。除个人简介外,它也不会显示在任何地方(与徽章不同)。这也不是衡量工作量的方法-我们正在努力以其他方式更好地展示人们为改善站点所做的所有必不可少的事情,并将尽快分享给他们。这是为了展示您的努力。
最初的方法论思想只是总结您所有帖子的总浏览量。但是我们在答案上遇到了两个关键问题:
我们真的不希望它包含社区中没有人认为有用的答案。
此外,我们甚至无法做到计算答案的观点,也不能仅计算在发布给定答案后出现的问题页面上的观点。
因此,我们意识到我们必须从定义一些关键目标和约束开始:
将是一个估计值,但通常在大多数情况下将是一个可靠的近似值,可最大程度地减少有意义的异常
可以应用于具有我们数据的现有帖子(这意味着我们不需要答案后的观看次数)
应将答案的计数限制为社区中某人认为有帮助的答案
应尽量减少只会增加很少的答案(可能没有人看到)的答案增加大量数字的情况count
仍然有疑问时,会在包括观点方面犯错-我们宁愿稍微高估志愿者,然后低估'em
将我们的标准降低为:
您的有用帖子很有可能被看到的页面视图。
这并不意味着我们知道访问者已滚动到您的帖子,还是您的回答对他们有所帮助-我们根本无法追踪。但是,我们应该能够估计观众认为给定问题或答案有用的可能性,而不必在疯狂受欢迎的帖子上启用第25个答案来幸运地投票并把所有观点归功于新作者。
这就是我们采用当前方法的方式,该方法对以下内容进行计数:
问题
仅未删除
答案-上级问题的答案视图:
未删除的AND
得分> 0 AND
也遇到一个或多个符合以下条件之一:
前3个答案中的OR
接受的答案是否为OR
得分至少5或
至少拥有总投票数的20%
(有关已关闭问题的注意:我们最初也排除了已关闭问题,但这似乎带来了弊大于利:那些本来不应该在这里的人几乎在被吸引之前就被关闭了,所以包括它们在内几乎没有什么关系,但是那些被很多观点关闭的人几乎都被允许回去了。那天,规则演变时分数急剧下降似乎比其他方法更具危害性,因为那里的影响很小。)
此查询非常接近原型中的内容。 (它需要进行一些细微的调整,以使其能够更好地与公共数据配合使用。)
我们如何才能使其变得更好?
我们需要您的帮助。让我们使用这个新数字来传达导致大多数用户感到疯狂的大多数背后的基本概念,并提醒我们其他人,为什么我们(希望)认为在此捐赠的时间比在许多其他活动中得到更好的捐赠我们可以在网上分享我们所知道的地方。但是,让我们做对。
无论我们进行了什么更改,我们都将添加一个工具提示,清楚地传达出该数字是一个粗略的估算值,并说明了其计算方式(或指向该方法的链接)。
很多人真的很喜欢这个数字的概念,但是它引起了两种特定类型的有用反馈:
方法肯定需要更清晰,并且可能是可改进的
称其为“拥抱挽救的兔子和幼犬“被帮助的人们”至少有点分散注意力,最糟糕的是使我们“肮脏,邪恶的骗子”。好的,没有人这么说。但是,差不多。
所以,我们希望您提供意见。
大问题#1:您是否有任何建议的调整措施可以改善计算方法?
再次,我们要做什么for大致是这样的:“对您的有用帖子很有可能被看到的页面的视图。”
请记住:
这不是纯粹的/完美的/科学的/实际上可以做的任何事情。
这是一个估计。
没关系,它不能分离出答案之前的观点,只要在一个常见问题的问题后发布答案的方式很不寻常,就算是很不寻常。
如果偶尔会出现奇怪的情况(只要这些情况相当少见),或者在
我们认为当前的calc在此方面做得很好,到目前为止,大多数反馈都更多地是关于名称与方法不匹配(相对于方法)正在关闭,),但我敢打赌,您可以帮助我们使这一估算至少准确一些。
大问题#2:什么叫更好的名字?
我们的目标是:
传达您在现实世界中所做的与众不同的事情-“页面浏览量”不能很好地做到这一点。 “人们帮助”显然唤起了这个概念,但是这个名字...
不应包含太多关于人们的感觉的虚假假设-如果它表明我们对可能的了解远不止于此,那么它显然分散目标的注意力。 (“从杀手蜂中拯救了4,052个婴儿-谢谢您!”)
目标是找到一个有助于传达这个数字的名字,这个数字代表了那些有相当大获胜机会的人们的粗略表述实际使用了您在这里所做的努力。
让我们知道您对问题的想法,我们可以着手改进此问题。
#1 楼
“人们帮助”一词并不能简洁地传达您上面所描述的内容,因为它看起来没有上下文。如果更改统计信息的顺序,可能会变得不太明确。尝试将顺序更改为:“ 60个问题,195个答案,207k人得到了帮助”。有点清楚。这是关于“到达”的。您应该说他们的贡献已经达到了207,000人。
如果您在统计信息中添加一些背景信息(如下所示),也会更容易理解。演示文稿应如下所示:
我真的很喜欢最后一部分。它使人们想到了这些帖子正在吸引该网站的成员以外的人。我正在玩的版本。也许您可以混合使用:
这些帖子已帮助
〜207,000
搜索此站点的人
或在上下文中查看时起作用的东西屏幕截图的上方:
通过该网站已帮助了
〜207,000
人。
希望他们之间有一些可以更好地传达您情绪的东西正在朝着。
评论
保持“到达”状态,放弃“帮助”状态,然后我开始同意统计数据不是一个完整的谎言。不过,我不确定该统计数据有什么用。如果我们要强调内容可以到达非用户,为什么我们不以某种方式可视化匿名反馈?
–吗?
2014年12月2日21:16
这真的是一个聪明的想法-如果我们进一步简化它,然后说“达到N个人”怎么办?我认为伸手可及的距离对您有所帮助,但不够明确,因此可以考虑以下事实:某些观点可能来自实际上未找到所需内容的人?
–劳拉
2014年12月2日21:16
@tohecz匿名反馈仍然需要人们选择与页面进行交互。有趣的是,我知道很多人都从阅读SO的问题和答案中获得了价值,并且从不费心去投票或提供匿名反馈-这就是我们在这里试图抓住的。
–劳拉
2014年12月2日在21:17
@Laura,这意味着我们可以思考:好的,只有c。十分之一的人使用自动对焦。然后,您就可以真正衡量推广范围了。但是如果没有这一点,这个数字就毫无意义。
–吗?
2014年12月2日21:21
@Laura很多用户不会理解只是“达到的人们”。特别是SE以外的用户。
– David Mulder
2014年12月3日,7:10
我本来会建议类似“暴露水平/比率”,但这种建议要好得多。欢呼,希望看到它得以实施。
–影子向导正在接种疫苗
2014年12月4日23:58
@Laura整个问题在于,直到最近,还没有人提到过应该被认为有什么好处的统计数据。现在很明显,没有人关心它的准确性或其他什么,它只是广告,我们生活在一个广告无处不在的社会。精细。
–吗?
2014年12月5日,0:29
对于“这些帖子已到达〜X个正在寻求帮助的人”,+ 1,其中包含的代号表示这是一个近似值。它的工作原理,并没有弥补。请不要称其为“这些帖子有所帮助...”,因为这是假定视图等于所提供的帮助,这是我们许多人不满意的谎言。
–doppelgreener
2014年12月5日在1:23
我更喜欢“寻求帮助”而不是“搜索此站点”,因为我怀疑在此登陆的大多数人实际上是在“搜索Google” :)
– Benjol
2014年12月5日在8:48
我更喜欢\ approx而不是\ sim。
–拉斐尔
2014年12月5日14:44
@Raphael这将暗示度量标准比可能需要的确定性更多。
–Air
2014年12月5日17:37
@AirThomas可能是“文化的”;在我的领域,\ sim比\ approx强。
–拉斐尔
2014年12月5日18:26
+1我喜欢。但是,如果有一个链接可以单击以了解度量标准及其计算方式,那么您不必担心精确的措辞。
– HostileFork说不信任SE
2014年12月5日23:09
在整个站点范围内,将问题年龄,问题投票,问题综合浏览量和(总/平均/(rms?我不知道))答案投票进行关联可能对设置正确的投票数很有用。
– jthill
2014年12月6日,0:15
刚开始时以“受过教育的人”为主题,但他们可能没有从该职位中学到东西。但是,为什么不说“ People Coached”,因为这就是我们正在尝试做的事情。
– Sablefoste
2014年12月6日下午5:00
#2 楼
名称:Impact或Reach。在算法上,我希望看到特定帖子链接的一些用法。当人们点击指向此特定答案的链接时,即使它恰好是答案4,也感觉那应该意味着某些东西,否则就不算其他了。仅从这些链接中添加视图计数是没有意义的(通常是很小的数目),但是我们可以找到某种方法来考虑它吗?也许其中一个作为“这些条件中的一个或多个”列表中的附加选项:
对此特定帖子的访问量至少有一定阈值(每个广播员25个)? (计算起来可能会很昂贵)
已为此(向任何人)授予了播音员徽章(易于检查,但可能会将门槛设置得太高)
评论
我都喜欢这两个名字。链接标准很有意义,但可能并没有太大的实际变化-直接链接到答案的观点很少,我敢打赌那些尚未达到标准的答案的观点太小而无关紧要。
–骑兵
2014年12月2日在22:08
@Jaydles是的,我在那儿混了两个数据。在大多数情况下,对引荐进行计数不会增加很多。但是,如果帖子正在获得推荐,那么即使它不在前三名(等)中,只要它的得分仍然很高,也许它应该会得到一些额外的爱。需要更多的思考。
– Monica Cellio
2014年12月2日在22:14
@Jaydles我进行了编辑;有帮助吗?
– Monica Cellio
2014年12月2日在22:27
是的,影响力是传统媒体(学术期刊等)已经使用的术语
– Ben Voigt
2014年12月5日在2:53
问题中多次提到“到达”一词。我认为“达到”和其他任何事情一样有意义。
–布莱恩·奥克利(Bryan Oakley)
2014年12月5日在22:44
学术文献中使用@BenVoigt Impact来引用您的论文。因此,有证据表明它确实确实有影响-它不仅是“给予”了对方,而且是对方“采纳”并将其纳入自己的工作。 “到达”的假设要少得多-它仅表示消息已到达接收者。接收者可能忽略了它。对我来说,“影响”假定它在收到后即起作用。
– rumtscho
2014年12月29日19:03
@rumtscho:除非您要谈论的是在影响因子高的期刊上发表文章,否则在这种情况下,这取决于看这篇新文章的眼睛数。
– Ben Voigt
2014年12月29日19:05
@BenVoigt的“影响因子”为3.14,意味着该期刊上的文章平均被引用3.14次。虽然它确实与眼球相关,但主要信息以及用于衡量它的公式是基于被引用的数量,在我看来,被引用是落入某人邮箱的证据,这很自然,这很自然(例如日记本)不是,这只是接触某人的问题。这就是为什么我认为“影响范围”措辞良好而“影响”措辞具有误导性的原因。毕竟,期刊不会使用废止数来计算IF。
– rumtscho
2014年12月29日19:23在
#3 楼
SE Academia SE的人们已经知道这个名字(尽管那里的概念有所不同):(鼓声)
影响因子
应以非常简单的方式修改IMHO的公式:取小数对数乘以10(熟悉的deciBel范式)。
为什么对数转换?为了让人们忘记最大化/跟踪此数字,并且仅在影响程度提高一个数量级后,才能从视觉上对其进行改进。我看不出从问题观点中得出答案影响的数学/统计可能性。即使使用JS的“阅读时间”统计信息(可能对我来说有点过分打扰),误差范围也仍然太宽。
我之前说过,让数字讨论为直接竞争声誉。这是轮廓重新设计的另一种方式。
评论
如果他们这样做,我将把用户名更改为“消灭了恐龙的陨石”,并询问为什么我的影响因子不高。 :D
–Scimonster
2014年12月2日21:47
“经常用作相对重要性的代表...”
– gna
2014年12月2日,21:57
记录日志是一个好主意。它使人类可以轻松比较数量级不同的事物。
–爱德华
2014年12月5日,0:13
-1:我怀疑许多用户会将他们的影响因素与其他用户进行比较。他们将主要查看自己的电话号码。通过要求用户理解对数的,非显而易见的公式,使该数字更难以解释,这将使该数字对单个用户的用处减少。
–凯文
2014年12月5日在2:18
@Kevin使得“数字对于个人用户而言不那么有用”正是我对这项建议的满意之处。我们已经有了代表妓女,我们真的想要影响妓女吗?
– gna
2014年12月5日在8:13
@gnat如果这样做的话,过一会儿他们将很难改善他们的影响因子,因为它的对数增加。
–doppelgreener
2014年12月5日在8:54
@doppelgreener对,我在这里喜欢对数增加,仅出于您提到的原因
– gna
2014年12月5日8:57
当我看到“影响因素”时,我会畏缩,因为这个词在学术界被严重滥用。 “影响”有些含糊,无法精确衡量。因此,精确的数字给人以错误的印象。如果要提供准确的数字,则最好测量可以清楚测量的事物,并为其命名,以准确反映其实际度量的内容,例如“页面浏览量”或“覆盖率”。
–本·科维兹(Ben Kovitz)
2014年12月5日14:18
@BenKovitz-SE开发人员设置的公式既不反映网页浏览量也不覆盖页面,并且恕我直言。我的帖子是尝试从柠檬中提取一些柠檬水。
–鹿猎人
2014-12-5 14:40
@DeerHunter我很欣赏您对质量和真实性的奉献。毫无疑问,任何数值测量都将牺牲简单性和适当性之间的权衡,这是不可避免的,因为当试图使一个数字代表复杂而无定形的数字时,这种情况不可避免。我只是希望可以选择该名称,以防止人们认为数字意味着比实际含义更精确的名称。
–本·科维兹(Ben Kovitz)
2014年12月5日18:33
@Dilaton啊,我不知道。我从未去过物理SE。我最初对原始stackoverflow.com上的出色质量感到震惊。事情已经到了我认为没有它就无法编程的地步。
–本·科维兹(Ben Kovitz)
2014年12月6日下午0:31
我怀疑新的统计方法将进一步提高普通大众受众的受欢迎程度,但以牺牲对认真学习的学生,专业人士和专家的有用性为代价,而这些学生自然是一小部分人。
–迪拉顿
2014年12月6日,0:33
@Dilaton-就超级对撞机问题而言太真实了。
–鹿猎人
2014年12月6日,0:35
@Dilaton-meta.stackexchange.com/a/66838/204631
–鹿猎人
2014年12月6日下午13:31
虽然作为科学家,我对数没有问题,但该统计信息的核心是以某种方式传达您的影响,这对于那些一开始对Stack Exchange一无所知的人尤其是也不知道其公式的人来说是可以理解的在它后面。最重要的是,有些人即使不知道对数公式,也不太了解对数。如果我们使用对数,那么我们不妨坚持信誉。
– Wrzlprmft
2014年12月22日19:51
#4 楼
度量标准关注点:对查看次数超过100,000的帖子的最新答案使用更严格的验证。也许,如果对某篇文章的观看次数超过100,000次,它的答案太晚了,那么它就需要有多个条件(例如,超过20%且排名前3?5?)。
对高视角帖子的最新答案的要求严格得多,以减少游戏数量。
命名建议:
达到受众群体数量
有用的帖子视图
重要的帖子视图
评论
我非常喜欢“有用的帖子视图”。这是一个相当复杂的数字的简洁描述。
–劳拉
2014年12月2日,19:13
@Laura我仍然不明白为什么我点击Qs和As会立即被认为是有帮助的。
–吗?
2014年12月2日于20:01
@tohecz因为绝大多数用户来SE都是为了找到解决问题的方法,而不仅仅是像我们可能那样浏览自己的学习内容。
– David Mulder
2014年12月3日,13:30
@tohecz-如果您浏览到一个问题,并查看头几个答案,并且没有拒绝投票,那么您至少表示您查看的内容“无用”。许多视图甚至没有投票的机会,并且用户常常会以能够投票的唯一目的创建新帐户,因为他们认为需要以某种方式回馈。
–特拉维斯J
2014年12月3日在16:03
特拉维斯-我不太确定那是有效的。来自SE外部的许多人可能会找到可以满足他们特定需求的答案,然后却不赞成。您不能认为缺乏投票就意味着不赞成(或不赞成)。这只是一个空值。
–Rory Alsop
2014年12月3日23:06
@Rory-我特别回应tohecz“为什么点击Q和As”。 downvote工具提示显示为“无用”,并且通过不降低投票率,至少可以看出它有些用处。它不仅是空的,因为鼓励此处的用户对无用的内容进行投票。在您的外部用户示例中,请参阅我针对那些订阅网络以在将来尝试投票的用户提出的后一点。
–特拉维斯J
2014年12月4日4:18
如果单独跟踪视图以寻找答案,则将有助于提高准确性,这样,对曾经很受欢迎的问题的较晚答案就不会“继承”该问题过去已收集的所有视图。 (实际上,这也将对其他事情有所帮助,例如用于关闭信誉良好的链接的rel = nofollow的算法。)当然,必须以某种方式对旧答案的初始视图计数进行估算,但是,这就是我们已经在做的事情。
–伊尔马里·卡洛宁(Ilmari Karonen)
14-12-5在0:54
#5 楼
我意识到这在屏幕空间或视觉美感方面可能是不可取的,但我会认真考虑使用文字代替数字:成百上千的人
成千上万的人达到了
成千上万的人达到了
成千上万的人达到了
数百万人达到了
,而且,如果到达范围小于“数百”,不要打扰显示它;如果它不只是“百万”,请仍然说“百万”。 (层数和顶层的级别可以进行调整,但是应该是固定的,非常粗略的层数。)
我提议这样做是因为它平衡了数量已经在各种答案和评论中表达过的主题:
我们要衡量的东西一定是不精确的(我会非常反对),带有很多猜测和胡言乱语。 br />我们想要一个与一些易于理解的单位有关的数字(因此,不像里氏标度或道琼斯工业平均指数那样)。这至少部分是为了满足用例的需要,即能够告诉亲人他们的朋友对某某人产生了积极影响。
我喜欢先前提供的使用对数刻度的建议;我的建议只是将其扩展了一点(并明确删除了将其转换为某种无单位“因子”的选项)。
#6 楼
为什么不选择基于著名的SE模因的东西呢?独角兽治愈了:4024
这有一个非常荒谬的名字的好处,它立即表明该指标不应太当真了它还没有对“帮助的人”做出任何毫无根据的假设。这是一个有趣的名称,可以确保在传达相关信息的同时,不会让任何人对它代表的内容感到费解。
评论
还是兽人被击败了? (我想到了巨魔被击败了,但这引起了整个“另一种意义”)。
–围嘴
2014年12月5日在16:29
我不知道有关兽人的任何SE模因。
–轨道轻赛
2014年12月6日18:01
#7 楼
正如我在启动该线程之前(目前尚未删除)所发布的那样:如何用尽可能少的黑魔法完成一个简单的“发布视图”?该术语使用了已建立并易于理解的词。 “帖子”被普遍用作问答的总称。 (为了简单起见,我们一直忽略评论。)“观点”也几乎没有被误解的潜力。它对应于我们在任何问题上看到的“已查看”一词。而且我们已经有了“配置文件视图”。
由于您无法准确地衡量视图的答案,因此必须有一些黑魔法。您可以采用总视图并将其乘以0
您现在拥有的很多东西都将归入该因素。但是,使用中性术语“发布视图”,我们可以取消关于视图是否实际上可以帮助查看者的假设。很难确定“视图”的数量,尤其是对于答案,甚至对于问题(请考虑深层链接)。
仍然:较少的猜测。本着这种精神,一个具有否定票数的问题的答案仍然可以完全算作-根据发布的时间点进行调整。
要考虑发布答案的时间点,我们可以使用统计方法找出一段时间后的总浏览量的典型波形,然后选择一个简单的公式以最佳地近似。
或者我们可以随意使用,只保存视图数发布以消除一个错误源的时间。可能是表
int
中的另一个PriorViewCount
列ViewCount
(类似于现有的Posts
)。绝大多数帖子最多只有三个答案。然后,您可以获得有关这些数字的准确数字。对于其余的视图,您仍将为视图的近似份额应用一个公式。忽略已删除的帖子(即使在删除之前有视图)。
如果这个东西足够流行,并且您有空余的位置,则可以提供两个数字:“总浏览量”(根据上文所述)和“估计有用”(应用更多黑魔法后的数字)。
PS:当我写“但这真的是个谎言”时,这并不意味着您是“肮脏,邪恶的骗子”。您为使个人资料更有用而做出的努力受到了广泛的好评和赞赏!但是人们通常乐于相信那些令人欣喜的新闻。很少有人会夸耀他们所谓的“百万富翁”,这很快就会变得荒谬。没有必要。这个网站的影响力十足,毫不夸张。
评论
像“每项统计都是谎言”一样说谎。向我+1。
–鹿猎人
2014年12月4日22:46
尽管在SE社区中人们对发布视图的理解是很好的,但对局外人来说意义不大……每个OP正是该指标的主要目的之一。
– David Mulder
2014年12月5日下午5:29
@erwin,我完全知道-这个笑话旨在(嬉戏地)传达您的观点-您是对的,他对夸张的看法破坏了实际影响。我们感谢您的反馈,希望您知道,夸张只是个玩笑!
–骑兵
2014年12月5日下午5:34
@Jaydles:现在,那一定是你那些偷偷摸摸的,肮脏的谎言中的另一个!11不,我认为我们很好。 :)
–欧文·布兰德斯特(Erwin Brandstetter)
2014年12月5日7:37
@DavidMulder:我可以看到意图。我会想象个人资料页面的典型访问者可以理解该术语。无论哪种方式,都只是一个建议。就个人而言,我对有意义的数字更感兴趣。
–欧文·布兰德斯特(Erwin Brandstetter)
2014年12月5日,7:44
+1这对我来说是个好主意。如果该统计信息只是用户获得的观看次数,则非常明显地是如何计算该统计信息的,并且相对容易理解某人应该理解该数字的上下文并在他或她的脑海中进行调整。
–凯文
2014年12月5日下午16:47
#8 楼
我发现后续步骤有点晚,但是我将再次重申我在其他答案中已经写过的内容,尽管这次我只专注于数字的计算。提案
问题
仅未删除
答案-父问题的答案视图为:
未删除的AND
得分> 0 AND
乘以平均滚动到的用户因子IF AND
在问题的一周内发布答案,如果不是NOT
乘以日期差(错误地),假设视图呈线性分布
解决方案是什么:答案位置
现在,具有三个答案的问题将始终计入所有答案,像这样的问题将平均得到17个(!!!)答案,而最后一个问题的243723位观众中的绝大多数将永远不会滚动到第一个答案。所以我建议的是StackExchange暂时添加跟踪代码,该代码根据滚动位置来跟踪实际的答案视图(这真的很容易编程,他们可能已经有此数据),然后此数据将在全球范围内用作乘法因子。换句话说,您将获得诸如
[1, .4, .2, .1, .09, .06, .......]
之类的全局因素的列表,例如,在某个位置获得答案的平均观看次数。当然,它仍然是一个近似值(由于泛化),但至少它是FAR更好的近似值。此解决方案是什么:发布日期
特别是假设以上原因出于某种原因未实现,那么现在用户将尝试通过搜索具有最多两个答案的观看次数最多的帖子来尝试对system1进行游戏。如果他们发布答案并获得至少一个投票,他们现在将获得该帖子的完整视图。替代先前的解决方案-或按照此建议;除了-还可以假设视图以线性方式出现(绝对不是真的,但它保持美观和简单)并以此方式分布视图。另外,一周之内的答案将被完全计入,原因很简单,这使计算便宜得多(因为在该时间范围内给出了很多答案)。之所以采用这种方法,是因为有可能纯粹使用现在可用的数据进行这些计算,从而使计算出的数字更加精确。
1我不认为很多用户这只会浪费时间,因为该指标仅显示在个人资料标签上,用户自己通常不会看。
评论
v。收集数据的好主意。
–鹿猎人
2014年12月3日,11:40
对于谁对此表示反对,请注意解释您对这些建议的改进会遇到什么问题?
– David Mulder
2014年12月3日13:26
好极了,更多人投票了,没有人解释...如此成熟的行为...
– David Mulder
2014年12月4日17:50
这是元的,不赞成票表示有人不同意您的建议。
–影子向导正在接种疫苗
2014年12月4日20:06
@ShadowWizard那么,毫无根据的分歧突然成为常态吗?无论是在主要站点上还是在meta上,都仍然有希望澄清投票。
– David Mulder
2014年12月5日下午5:31
我没有拒绝投票,但是没有,没有这种期望,而且从来没有。这就是为什么拒绝投票是匿名的。我认为这是一个合理的建议,但这并不意味着不同意它的定义是“毫无根据的”。
– terdon
2014年12月5日在8:13
@terdon Ehm,因此,如果没有这样的期望,那么为什么新用户会显示消息以解释评论中的降票?的确,如果您非常学究,那么您可以说这只是礼节,而不是期望,但是礼节不过是一种文化期望,因此也不可行。
– David Mulder
2014年12月5日上午8:30
@David不,任何人都可以投票。这就是它的工作方式。如果您不想参加,没人会强迫您参加。
–影子向导正在接种疫苗
2014年12月5日在9:09
@ShadowWizard当然,没有人强迫您,期望就是期望。我不知道,没有人被迫用刀叉吃饭,这并不意味着没有人期望有礼貌地吃饭。
– David Mulder
2014年12月5日,9:13
是的,但是当有人张开嘴吃饭时,其他人则可以自由表达自己的不同意见。
–影子向导正在接种疫苗
2014年12月5日上午11:15
不确定我是否喜欢滚动位置指标-该指标必须有太多的可变性。按发布日期按比例分配是有意义的。由于许多观点是在第一周出现的,所以它可能仍倾向于后期的答案,但这似乎是我们可以对已跟踪的指标进行的最佳处理。
– AmeliaBR
2014年12月5日15:51
@ShadowWizard到底是我干了什么,您攻击了我什么?
– David Mulder
2014年12月5日下午16:40
@AmeliaBR我知道那个变量有很多可变性,但至少比前三个指标更公平吗?我的意思是,通过大量工作,您可以使它更加公平,但我要谨记,这只是个人资料页面上的一小部分,而不是SE的某些主要功能,我认为所有这些都可以实现公平的平衡。
– David Mulder
2014年12月5日下午16:41
另一个答案建议使用upvotes的时间分布作为代理来计算视图因子。
– Nemo
2015年5月4日在8:59
#9 楼
问题出在“人”这个词上,而不是实际的人。截至今天为止,该统计信息现在显示为X人已到达
我认为仍然存在问题,不是,不是,不是关于“帮助或达到”一词的说明。
1个人可以是100个人。这意味着人民是独一无二的。我所帮助的每个人的指标应提高1。
情况并非如此,如果一个人查看了我的100个帖子,突然他们算作100个人。考虑到超过1个用户可能会发生这种情况,并且已经达到或帮助的“人员”明显被夸大了。
真正帮助了谁或谁?
实际情况是,一个人遇到100个难题,难题,问题或查询,导致他们查看了我的100个帖子。我认为这就是标题中应该涉及的内容,并且仍然与人相关。这些难题,难题,问题或询问的源头是人,这仍将粗略地表明已经帮助了多少人,同时又没有夸大确切的人数。
100个难题[帮助|辅助]
100个难题[帮助|辅助]
100个询问[帮助|辅助]
100 [有帮助|正]?合作
我相信其中之一可能是更准确的描述,同时仍传达有用的术语。
定义
四进制:在困难情况下如何做的困惑或不确定状态。困境:必须在两个或两个以上之间做出艰难选择的情况更多选择,尤其是同样令人讨厌的选择。查询:要求信息的行为。合作:共同从事一项活动,特别是生产或创造某种东西
#10 楼
如何使算法保持简单: (views on question) * (score of your answer)
"people helped" = ------------------------------------------------
(total votes on entire question and answers)
(我现在使用的是“人帮忙”,但实际上并没有提议使用它作为名称。)
其他注意事项:
“您的答案分数” =赞成-赞成
“整个问题的总票数” =赞成+赞成**
*因为所有赞成或反对表决都来自某个视图。 IOW,某些视图实际上并没有帮助任何人(尤其是如果他们投票不足的话)
渐近有意义。
更多可以避免针对热门问题进行游戏。
鼓励以很多观点回答未回答的问题。
缺点:
可能产生嘈杂的“ up-
可能的调整:
将“所有帖子的总票数”改为“总投票数”所有帖子”。 (由Servy建议)
包括匿名反馈。
评论
可以进行大量调整:例如在投票计数中包括匿名反馈。
–神秘主义者
2014年12月2日在19:20
将答案投票的百分比用作乘数会导致一系列奇怪的行为。最常见的是,即使您的答案始终是最重要的,每一个获得选票的新答案都会减少您的人数。
–骑兵
2014年12月2日在19:22
我非常喜欢这一点,因为它使人们不愿去回答最流行的问题并坚持回答。在这些情况下,增加该数字成为一种相当差的策略。
–服务
2014年12月2日在19:22
@Jaydles这是不可取的吗?我认为您应该从一个问题(其中是您唯一的答案)中获得更多的统计数据,而不是一半的人认为他们需要寻求另一个答案来获得帮助。您的回答仍然很有帮助,只是没有帮助。但是确实需要处理的一个情况是,新的错误答案得到大量的否决票会降低您的感知帮助。那没有道理。总票数可能只需要总投票数即可。
–服务
2014年12月2日19:24
我们是否要为得分为负的帖子添加负值?
–服务
2014年12月2日19:25
@Servy,这只会产生一种怪异的体验-如果您有一个4票的答案,然后其他人获得了投票,您的“有用的观点”或其他因素下降了20%,这似乎有点不对劲。而且,如果我们专注于潜在的滥用行为,那么这可能会引发许多奇怪的投票诱因-增加投票乘数意味着对所有竞争性答案进行不赞成投票将使这个数字在几乎每个问题上都得到解决。
–骑兵
2014年12月2日在19:27
@Servy这是一个好问题。如果一个答案不好,那是在浪费人们的时间,那么这是否具有“负面帮助观点”。我的看法是。
–神秘主义者
2014年12月2日在19:27
@Jaydles使用本文中的公式,对竞争性答案进行投票表决会损害您自己的得分(增加总投票数而不增加您的帖子或视图的得分)。如果没有,则对您的分数没有影响。无论哪种情况,它的确会降低您不满意的答案的分数。
–服务
2014年12月2日19:30在
@Jaydles我认为这里有两个(有些矛盾)的目标。渐近有意义的数字,或小范围有意义的数字。我提出此算法是因为它具有渐近意义。但这可能会导致较小规模的怪异现象。解决此问题的一种方法是在每次更新时记录答案的当前“人员帮助”分数。永远不要让它跌破它。
–神秘主义者
2014年12月2日在19:31
@Servy,我认为您是对的-我感到困惑。但这也不奇怪吗?如果有人添加了一个可怕的答案,您的分数每次被否决都会下降吗?
–骑兵
2014年12月2日19:34
@Jaydles这就是为什么我建议使用总投票数而不是总票数的原因。
–服务
2014年12月2日19:55
这在渐近意义上是有意义的,但与原始概念一样,它与帮助无关。
–吗?
2014年12月2日于20:04
@tohecz这与帮助有关系,这只是信心度很低的一项统计。这种信心当然不是零。
–服务
2014年12月2日在20:08
@tohecz不,但是它的作用是将范围非常狭窄的真正有用的问题与范围广泛的真正有用的问题区分开。
–服务
2014年12月2日在20:28
这给我们带来了一个基本问题,那就是该指标衡量的是受欢迎程度,而不是帮助程度。
–吗?
2014年12月2日于20:33
#11 楼
我认为这是David Mulder建议的一种变体:显然,“观点”太高了。我知道,当我寻求帮助时,我会很乐意在10个标签中打开前10个链接,而且通常连阅读最后一个标签都没有达到目的(或者相反,我可以一直走到最后,帮助。)
但是,您对人们倾向于停留在页面上多长时间有任何统计吗?以及它是否取决于答案的数量(或仅取决于文本的长度)?在这种情况下,您可以应用某种全局“因素”来将视图计数降低到更现实的程度。
评论
我同意。在发送http请求以增加计数之前,将简单的javascript setTimeout设置为内容长度的合理持续时间会更准确。很多时候,我发现一个帖子看起来像是我所需要的,但是在页面上几秒钟后,我意识到它不是,然后回到了Google。因此,该职位当时对我没有帮助。
–SnareChops
2014年12月6日7:05
#12 楼
我想提出的建议是恢复人们的帮助,同时也使计算更加保守。让我们预先承认这个数字是一个令人愉快的小说-我们无法对访问每个问题的每个人进行调查,以找出哪个(如果有)答案最有帮助。除了衡量选票之外,没有合理的方法知道帖子是否对其他人有所帮助。 (我们已经有了一个估算直接投票所帮助的人的系统:声誉。)几乎每一种方式,只要用户每次有帮助地提问或回答一个问题,我们选哪个数字都没有关系。当数字变大(超过几百个)时,很难将它们形象化。我们与大数相关的唯一方法是将它们与其他大数进行比较。
使用“有人帮忙”标签的麻烦在于,我们有各种方法来衡量有多少人访问该站点。每天只有不到1万人拜访MSE,因此似乎有报道称有数百万人得到了帮助。也许这是一个不好的例子。杰夫可能以一种或另一种方式帮助了更多的人。但是,当您四处浏览别人的个人资料时,您不可避免地会发现通过Jon Skeet事实帮助约14万人的人们。请记住,该站点只有11万9千注册用户。
因此我们可以开始消除Community Wiki之类的极端情况,这在任何情况下都可能是有道理的。但是,我们仍然会遇到一些问题,这些问题会导致观点过大并歪曲结果,从而打破了那种幻想,即数字代表正在帮助的实际人员。对每一个观点给予充分的评价,一个问题对每个问询者都有帮助,许多回答者对我来说是直截了当的。在询问者和所有应答者之间:
通过这种扩展,回答乔恩·斯凯特(Jon Skeet)事实问题的答案可能对3600人有所帮助。我不是建议使用建议的公式来说明谁将获得信用,而是建议提问者因帮助了许多人的问题而获得信用:
至少有一个答案,
的得分大于0,并且不是社区Wiki。
如果有答案的话,它可以帮助别人,这会得到赞誉:
得分大于0,并且不是社区Wiki。
请注意,对于经常回答的问题(也经常被高度关注),这将比原始问题贡献更多的答案式。但是,考虑到对数缩放,“人员帮助”信用总额将低得多。这些标准还可以防止未回答且得分较低的问题被视为仅帮助查看问题的人员。
根据此算法,Jeff Attwood仍将为37.9万MSE人员提供帮助。乔恩·斯凯特(Jon Skeet)将为960万人提供SO服务(去年同期为1.03亿)。这些数字对我来说是正确的。它们是绝对错误的,但是也很有可能是合理的。
*幻觉比任何准确性都更为重要。 《文明》电脑游戏的设计师Sid Meier指出:
游戏玩法是一种心理体验:我的游戏基于铁路,海盗和历史等事物,并且我尝试制作我设计的游戏是真实的。历史越多,越现实,越事实越好。铁路和海盗越多越好。但是我以为我知道是错误的。在我职业生涯的早期,我没有考虑过球员的脑海。通过承认一个简单的概念(游戏性是一种心理体验),它可以使您的游戏变得更好。
评论
我仍在阅读此答案,因此我无法如实评论实际内容.... IMO,此帖子可能会以新的问号更明显。(较早的问题,26个答案等)
– MTL
2014年12月18日,下午3:56
我读到的“帮助了人们”的名字表明了相当精确的度量;这似乎与计算的近似性质冲突(FWIW近似本身对我来说似乎很合理)
– gna
2014-12-18 8:57
#13 楼
尽管我认为这可能是一个离题的问题,但这是一个潜在的因素:首先,除选票计数外,其他任何事情都不能掩盖其有用性。即使这样,也必须查看其年龄并将其与观点和选票进行比较。一个拥有5万年历史,拥有10万次浏览量和+300票的帖子,与6个月前发布的具有2千次浏览量和+20票的帖子相比,没有什么相关性。我必须在脑海中进行一次神秘的计算,以确定页面的有用性得分。例如,此页面的得分目前应该是正确的。后来,随着年龄的增长,它会变得越来越少(除了meta SE的后代之外,对所有人都没有用)。此外,投票计数绝对没有任何意义。对于投票方式,我有点固执己见,但是即使我仍然发现自己出于错误的原因而投票;幽默,危险图片等。并非总是一个帖子是否“有用”。 +1可能意味着各种各样的事情。
您不能使用当前数据集来获取新的统计数据。我要说的是,在我投出的〜1000张赞成票中,〜5张是对我实际上有用的东西,而不是我认为它对某人有用。对于每个答案,我们都需要像“收藏夹”按钮这样的“刻度”。 “这是对我有用的建议”。谁留给OP来决定什么是对的?社区接受的答案在哪里?您知道,在接受答案的情况下,有700个以上的赞成票...(每天限制一次,否则人们投票时都会同时点击两个)。也许有些正面的旗帜也会起作用。 >这是一个很好的例子(尽管我不同意其中的内容,但我的意思是这样的数字):
“工艺”的性别中立替代品?海事组织,没有人能找到该页面有用,我认为《任择议定书》几乎没有做到。该页面上的数字仅告诉我们如何获得满足感。没关系,热名单可以做什么来歪曲页面的数字……那是整个“豆袋”。
TL; DR
您将不会因毫无意义的异常(投票)而无法获得“整体近似值”。
我们绝对无法得知“社区中有人认为它有帮助”(删除这些注释,还记得吗? )
任何增加了一点的答案:忽略所有“最新答案”。只有不关心rep late-answer的人。
只包含视图的意思是没有意义的。视图并不意味着我已阅读。
我们拥有的衣橱里的东西是“收藏夹”按钮。当我找到我想引用的内容时,会将它们用作书签。以后不链接,而是供我在现实世界中使用。我认为很多人都使用它们在正在观看的页面上保持标签;仍然可以从中获得“有用性”。但是,您只能选择最喜欢的问题。不是“这是我最喜欢的答案,因为它对我有用”。该信息在(虚拟)投票中丢失。
评论
如果您想参加SE感到愉快,请阅读博客,然后发生奇迹
–马祖拉
2014-12-18 0:00
#14 楼
精神计量学辅助因素好,好。不要这样看着我。
这里的理由是:
它被设计成符合人类的感知
,它试图证明如何为人们提供帮助
这是一种估计
它实际上并没有明显的计量单位
“心理测量”一词相当晦涩,但实际上意味着一种测量根据人类感知模型进行了调整。例如,音频工程师使用“心理加权”来量化人类对噪声的感知。我们正在寻找一种与我们对这一概念的总体看法相符的类似调整,并将对其进行调整,直到它(有主观但有一定共识)与我们有意义地参与此处的含义相符为止。
“协助”一词虽然是推测性的(我们并不真正知道有人在帮助,但我们是通过间接测量推断出来的)捕获了一些有关我们至少试图量化的内容。
“因数”一词同时传达了它不是完整的东西而只是一部分的概念,以及它是无单位的并且不能真正转换为弗隆,公斤或猫视像时间或任何其他物理测量值的概念
另一件事是,由于该短语在互联网上很可能是唯一的,因此任何搜索定义的人都可能会被发送到Stack Exchange星座中的正确位置网站。
评论
我喜欢按加权表达的想法,但是我不确定您选择的单词,不禁卡在您的第二句话上。
–特拉维斯J
2014年12月5日,0:37
它有很多工作要做,但似乎不是……有点太明显了吗? :p
–骑兵
2014年12月5日下午0:38
我也不确定我的选择。只是把它扔掉,以进行辩论,修改,采用或丢弃,这似乎最适合该小组。
–爱德华
14-12-5在0:38
+1为我学习了一个新单词。另外:PAF! :)
– Benjol
2014年12月5日在8:56
#15 楼
由于“已接受”答案有很高的实际阅读率(甚至可以帮助观看者),因此我认为“已接受”答案应该始终得到认可-即使投票数为0。我们也不应仅仅因为提问者发生而对答案进行惩罚对SO来说太陌生而不能投票(或者知道他们可以)。所以,我建议更改:
Score > 0 AND
转给
(Score > 0 OR Is the Accepted Answer) AND
如果这样做,那么我们将把所有未删除的已接受答案的回答者归功于他。
#16 楼
对我而言,唯一有意义的是显示某人帖子的匿名投票统计信息。原因:此统计信息从未显示过,可能非常有趣且有意义。信誉。
非注册用户可以通过匿名反馈进行投票。他们的拜访本身可能是非常无关紧要的噪音,而且经常可能是。
我仍然看不到视图与有用性如何相关,所以我也看不到为什么我们要对其进行衡量并给它起任何名字包含“有用”或“有用”。
但是,如果我们希望基于投票保留统计信息,则应使用以下名称命名:帖子受欢迎程度或类似名称。
#17 楼
忽略零分问题可能会对在小众类别中做出巨大贡献的人造成轻微的惩罚。我认为我的很多答案都代表零回答,因为a)他们是唯一的答案,b)他们只帮助了一个或两个人,c)这些人不知道这个网站的运作方式,所以他们不投票或接受答案。我没有具体建议。也许包括超过两个月大的答案,并且得分为零,并且是唯一的答案,而这个问题是由没有投票的人提出的。或类似的东西。也许对于几乎每个人来说,这个数字是如此之小,以至于毫无用处。
评论
不确定。如果我为利基标签做出贡献,则“达到的人”分数很高,这让我走了“哦,不,大众化!”在好地方奖励有用的工作是复兴/死灵法师/ ...徽章(应扩大)的工作。
– Nemo
2015年5月4日在8:53
是的,有一个论点是只排除得分不高的答案。零分意味着没有人找到好的答案。负分数更说明它不是潜在的有用贡献。
–fixer1234
17年7月25日在17:35
#18 楼
搜索引擎推断其服务“满意”的方式是通过测量用户点击链接所花费的时间。如果用户在不到5秒的时间内回来(或另一个任意截止时间,可能对此进行了研究)以单击下一个搜索结果或开始新的查询,则他被视为“不满意”。现在,这并不是一个完美的指标,但这是Google和Bing如何向您展示不仅具有较高网页排名而且与您的查询相关的内容的一部分。它在技术上称为
dwell time
,并在诸如此类的论文中进行了描述。我意识到Stack Exchange可能尚未跟踪该指标。但是,如果是这样,该数字肯定可以包含在公式中。如果没有,它可能在型材装饰之外还有内部用途,因此值得进行跟踪。
#19 楼
您能否继续为每个答案保留一个单独的页面浏览计数器,该计数器只有在答案发布后才开始增加?例如,假设我写了一个问题,该问题在存在的第一周就获得了100万的观看次数,并且得到了很多人的好评。问题本身和前几个答案都有各自的观看次数,分别存储,并且每当有人查看该页面时,所有这些计数器都会增加。然后,一年后,新用户涌入张贴有见地的答案。在发布的当天,它还具有自己的视图计数器,该视图计数器从0开始。每次有人查看问题时,它也会增加,但其开始位置比旧问题和答案已经拥有的视图低得多。在几个月的过程中,新答案获得了五次投票,并且对该问题的查看次数超过了数百次。一旦答案获得第五名好评,它所获得的数百个视图便被添加到用户的“人们帮助”计数中。
评论
这可能与关于哪个答案在最前面以及何时出现的知识结合在一起,以避免速射答题者获得错误的统计信息
–大卫·威尔金斯(David Wilkins)
2014年12月5日19:26
我打算提出类似的建议,但使用的方法略有不同。只需将问题视图的计数存储在Posts表中发布答案的时间,并将所有现有行的默认值都设置为0。
– MBraedley
2014年12月6日在3:35
#20 楼
不确定您有哪些约束与几个徽章相矛盾,尤其是:没关系,它不能分离出答案之前的视图,只要它非常
可能会与复兴和死灵法杖徽章相悖:
Necormancer
在60天后以5分或更高的分数回答了一个问题
这可能是很常见的情况,因为SO上的Necromancer徽章似乎是唯一的获得的银质徽章比其同等的铜质徽章次数更多:
实际上,重新阅读这些文字后,它们之间的关系松散,因为铜牌只是如果您是第一个答案,则将获得奖励,任何答案均可获得银奖。
评论
关于徽章的要点。正如对拟议的黄金版本的查询所显示的那样,实际上很难获得对古老问题的答案的投票。
– Nemo
15年5月4日在8:51
此标准与徽章不符,并不能充分反映帖子对主题统计的贡献。如果一个旧线程有10万个视图,并且您发布了一个很好的新答案,则该答案不会对以前的任何视图产生影响。计算所有视图将使您对答案的影响大打折扣。
–fixer1234
17年7月25日在17:28
@ fixer1234确实-我认为当时我的想法是,如果您确实对一个老问题得到了5分或更高的评分,那么单靠这个问题可能并没有帮助那么多人-如果没有答案在上面,或者说没有很多好人,那么除了说“你并不孤单”之外,这实际上并没有帮助所有这些访客;)
–扎夫-本·杜吉德
17年7月26日在8:13
#21 楼
对于第二个大问题,我只能提出一个主意。大问题#2:更好的名字是什么?
我花了两个多小时的时间阅读所有连接从亚伦·斯沃茨(Aaron Swartz)26年的生活中产生并产生的链接,故事,轶事,推文等。
尽管我无法说我知道他一定是什么样子生活中,我对这两个小时内建立的联系数量感到震惊。与我的生活直接相关的人际关系,使人们对男人,女人或年轻人充满激情的事物产生了一丝微光。我一无所知,对Python编程语言或与“网络”技术无关的东西也没有特别的兴趣,但是尽管如此,我还是在Aaron Swartz的链接,推文和博客文章之后发现的。
结果,我想到了以下内容:
-[10k]位访问者已连接
我认为动词connect可以在不同级别上解释
连接在一起或建立联系,以便建立真实或概念上的链接。
提供(某人或某物)链接或与之建立联系。
链接至以下来源[信息]供应。
#22 楼
得分> 0 AND
那么,无名英雄,不是真正的英雄吗?
评论
否则,它们将不会被“取消”。
– Nemo
2015年5月4日在8:54
@Nemo好点!
– falsarella
2015年5月4日在17:17
即使我们唱歌一点,他们仍然是英雄。
–fixer1234
17年7月25日在18:08
#23 楼
我认为这是一个很棒的主意。我还认为,如果像暗示的其他统计数据得以实现的话,这将是代表用户价值的更好指标,而不是代表人数。但是,我同意Erwin的名字应该是
X
查看的时数相当明确,但我认为可以将其改进为X
Times的访问时数。访问比我认为的更没有歧义,因为它暗示人们在以后的某个日期重新访问帖子,我认为这更接近事实。我亲自访问了许多帖子再次遍及整个网络,其中一些我已回答,一些我已发布,一些我从中学习,复制代码段或遵循其中的说明。从我所了解的如何计算页面浏览量来看,我认为我自己的许多访问都将注册一个以上的页面浏览量,尤其是在不同连接上使用不同设备的情况下;以及几天或几周后再访问。
所以总结并重申:
曾访问X Times的帖子
换句话说,我认为如果我们在3或4个选项之间进行选择,这会很酷,并为我们的应用程序添加了个性化/定制层配置文件,并在此过程中使每个配置略有不同。 (有人在数十亿条评论中提出了这样的建议。)
评论
帖子被访问或查看的次数与它的质量绝对没有关系。这个数字通常甚至与帖子的级别无关(至少在科学网站上如此):大众化,基本的帖子是每个人都可以理解的,因此当然,更多的观点和访问,而专家和高级学生可以理解和赞赏研究级的非常高级的内容。看来SE现在正在认真优化软件的所有功能,以使流行的内容胜于研究/专家级的贡献...
–迪拉顿
2014年12月5日在22:19
#24 楼
我建议使用多个公式并取平均值(或众数,或中位数,或采用任何合适的统计方法)我建议使用多个以上的不同公式,每个公式各有利弊。因此,对于那些很晚才回答常见问题的人来说,一个公式可能会比较软弱,但是其他公式的行为却相反,因此它们可以相互平衡。
您可以使用的东西
您可以使用各种统计数据,我想到的是:
其他具有较高票数的答案的票数越多,覆盖面越小(效果或帮助力)。例如,对于一个具有五个投票的问题的答案,与具有五个投票的另一个答案相比,具有五个投票的答案,其影响范围较小,但另一个只有七个投票的答案。
将观点和投票和StackExchange的某些常量可能比仅考虑视图有用。还要考虑第1点。
前N天忽略视图。您可能会在前N天忽略视图,因为初始视图通常是由活跃的用户四处徘徊。他们不是得到帮助的人。 N将取决于特定的站点。
我会记住更多内容。
评论
我认为数据库中没有存储有关视图随时间变化的任何信息,而仅存储总数。但是它们可以在N天后取样并存储。这是否适合数据库的当前结构?
–P.Mort。 -忘记了粘土Shirky_q
2014-12-7 8:37
#25 楼
听起来像个好主意,但并非如此。我现在想到以下原因:只要不记录观看次数就可以方便地作弊,只要该观看次数可以跟踪特定一天的访问次数即可。
据我所知,网络爬虫对访问量有很大的影响,增加了更多的访问量,这会影响搜索结果,使其变得更无用。
声誉是准确的,并且可以一眼看出一个人的帮助程度。
除了声誉,我们还有徽章,每个用户都擅长的标签,投票计数,活动等。所有这些项目是准确的。
恕我直言,由准确数据组成的索引要好得多,它不必是“人们帮助”的。我这样做的主要原因是从data.se中发布的查询得到的结果,它表明我已经帮助了Travel.SE中的700,000人,我确定我什至没有帮助过10%。
评论
这是正确的,但不像所暗示的那样精确。声誉飞涨的原因是错误的,例如对HNQ的幽默回答根本没有用,而对利基问题的出色,有用的回答却没有引起关注。作为一个知识库,声誉是一个聪明的指标,但并不总是反映答案的质量或有用性,也不代表对所有问题的一致衡量。这个问题,尤其是它的标题,大多吸引了人们的意见。答案得分更多地是由问题驱动而不是答案。如果一棵树掉在森林里...
–fixer1234
17年7月25日在17:48
#26 楼
我遇到的“到达的人”的问题是,这里有很大的潜力可能会加倍(或更糟):如果我继续发布例如Minecraft的出色答案,那么太好了,我正在帮助很多人,但我可能不能每次都帮助一群不同的人。原型只是将视图汇总在一起。更准确地衡量了我的贡献有所帮助的总次数。
并不能真正帮助我们命名正确,但我认为将被计数的事物称为“人”是不合适的。
怎么样,也许是:“隐喻的日子得以保存。”如果隐喻地讲,如果我的职位有帮助,它可能可以节省某人的一天。重复计算天数是很好的,您甚至可以无缝地扩展以计算“隐喻月份”,“隐喻年份”,“隐喻千年”等。
这是杀手级功能:如果您感觉真的很厚脸皮,您可以将其称为“元气”(“元气”,“元气”,...)。
评论
供参考:我在MSE上节省了533个元年,但在Arqade上节省了7.2个千年。乔恩·斯凯特(Jon Skeet)在279个千禧年的发展历程,因此我们不会很快就需要一个成千上万个千禧年的名字。
– Badp
2014-12-13 19:36
我更喜欢“ bogopeeps”
–Shog9
2014年12月13日19:39
相关答案:“问题是“人””。
– Nemo
2015年5月4日在8:58
#27 楼
我正在写的某些内容似乎似乎甚至显然都无法实现–但是我将在最后解决这些问题:[…]我们也不能仅将发布给定答案后出现的问题页面上的视图。
但是您拥有投票时间,投票时间与可以投票的用户的访问时间相关,反过来又与整体观点相关。因此,作为第一估计,您可以通过获取投票的时间分布来估算视图的时间分布,并通过将其乘以[视图数] / [投票数]来重新归一化。对此有两个调整:
仅考虑用户对帖子的初次投票而不是所有投票,因为这可以更好地估计具有投票能力的用户的访问。 br />以上估计当然不是完美的,例如,我希望实际视图分布的时间平均值要比投票分布的时间平均值稍晚一些,因为最初的投票来自SE超级用户而不是人有类似的问题。但是,由于此而引起的错误大部分是系统性的,即,对于所有问题,其行为都相似。因此,为了更正它,您只需要查看几个问题的观点(和投票)的实际时间分布,而不是全部。即使您根本没有任何数据,也可以立即开始生成此数据,因为这两个分布之间的最大差异可能会在询问问题后不久发生-或换句话说:这些分布具有相似的特征尾巴。
但是,当然,您可以在不估计视图的实际时间分布的情况下进行处理,因为统计信息不需要(甚至不应)估计有多少人查看了问题,而是有多少人在一定程度上有用。正如在其他一些答案中已经提到的那样,我们唯一需要评估的方法就是投票。不幸的是,并非每个访客都能投票,但是我们可以将选民用作观众的代理。鉴于您只能对实际内容进行投票,因此这也会在一定程度上自动解决滞后答案的问题。结果统计信息将是:
number of visitors
score (per question) = ——————————————————————————————————— × upvotes
number of visitors that could vote
对此有一些评论:
一个自动功能是,它解决了哪些问题很受欢迎,但缺乏很好的答案。
我选择只在此处包括考虑投票,因为在某种程度上我认为这是更好的帮助措施(也考虑到投票比较复杂,因为可能会有相当数量的访问者可以投票,但不能投票)。
一个明显的调整是要更加重视请求者的投票以及接受的答案(要适当考虑是否存在从未投票或接受任何内容的提问者)。
对此,另一种考虑是是要忽略观点,潜在选民的观点以及在问题发布后不久发生的投票,但提问者的投票和对号除外。这样,对于那些可能遇到与问问者类似问题的人,您将获得更好的估计。如答案的第一部分所述,这将再次需要对访问的时间分布以及可以投票的用户的访问进行良好的估计。 (如果您想走得更远,请排除问题提出后不久发生的所有事情。)
当然,这要求您以某种方式记录可以投票或至少对此有很好估计的访客人数,例如已登录的访客人数。如果没有,那么可以说第二佳的可比分数可以说是Mysticial所建议的分数。
虽然我不是数据库专家,但我可以猜想我的一些(或其他)建议似乎由于需要太多查询,因此不可行。但是,很可能是个人用户帖子的一小部分弥补了他的大部分得分。在这种情况下,仅对那些重要的帖子就足够了。
#28 楼
只是为了给头脑风暴增加另一滴水,“翼展”怎么样?您帮助的人越多,看到答案的人就越多,或者您的翼展越大。 >
雄伟鸟类的涵义-翼展越大,它们可能飞得越远。飞机的含义-翼展越大,飞机可以携带的越多(意味着可以携带多少人,或者可以为人们提供多少支持)
有点异想天开。
评论
Lemme猜测:接下来您将要讨论炸弹的载荷,不是吗? :P'与他人接触并触摸某人会使其韵律更好...
–鹿猎人
2014年12月5日23:18
#29 楼
我有个主意。请注意,我并不是说这更好,它只是反映了“大多数人希望得到的帮助的人数”。我越来越同意!如果您不这样做,则可以使用现有的系统,该系统显然具有优势,尤其是包括未注册的用户。但是,存在严重的劣势,即计算甚至不喜欢您答案的人数和多次计算人数。我们想衡量人,对吧?为什么要烦恼那些过分夸张的观点呢?我只会坚持使用注册用户。我的站点德语堆栈只有大约1万。确定我是否曾经帮助过某人的最直接方法是跟踪他们是否曾赞成我的答案。如果您愿意,可以这样做。
无论如何,整个数据只是一个带有二进制条目的10K x 10K矩阵。我认为存储起来并不困难。矩阵可能很稀疏,那么它甚至更容易存储。
您不需要更新此计算寿命!您已经存储了所有活动。每月检查一次矩阵。非零元素甚至不需要检查。如果矩阵由于大多数人互相投票而变得密集,那么您只需颠倒1和0的角色。我不知道社区的工作方式,因此我无法提供好的设计思路。
就个人而言,我可以省略未注册的用户,因为我非常喜欢保守的估计而不是过高的估计。但我知道这纯粹是一种品味问题。在这种情况下,我想知道未注册用户所代表的观看者所占的百分比。为了使视图具有某些优势,它必须很高。我认为高票与低票的答案之间存在明显差异。对于低于50的选票,我怀疑大部分访问量是由提问者和一群回答者产生的,他们每次访问5-10次。我网站上的典型答案有2-3个答案。以我的假设,那将产生来自询问者和回答者的15-40意见。
另一件事是,如果我们赞成视图,那么我们至少不能分开IP吗?这样,当我返回编辑答案时,就不会像往常一样给答案十个意见。仍然,有些人会被计数两次,而一些稀有的人会算为一个,但这应该是一个很大的进步。即使我只存储了一天的IP,但目标却是像“单独的视图”而不是“单独的IP”。
我个人以前对这个数字感到非常自豪。我以为“可能不会是14K”,但说是1500。”但是现在我知道统计信息是如何产生的,我再也不会以自豪的眼光看它了。甚至连滚动到Mary回答的人都想“地狱,是Ludi的回答废话!”,现在算是有所帮助了:(
由于这使我感到非常失望,我发现自己甚至在考虑以下对未注册用户不友好的方法:显示一个long(!)预览答案,然后让他们单击“继续”。虽然这无法衡量帮助程度,但至少可以衡量兴趣。
评论
一个简单的计数应该在票数表上不同。数据已经在那里。我不确定是否喜欢您的要求。
–帕特里克·霍夫曼(Patrick Hofman)
16年7月18日在11:25
@PatrickHofman哦,这不是要求。只是一个建议。我认为它更好地反映了许多人似乎在追捧的受援人数。但是对我来说,只要我能读,任何变量都和其他变量一样好。
–路迪
16年7月18日在11:30
这里的主要缺陷是,许多人只是查看答案,却没有考虑,使用和继续前进。而已。没有痕迹,唯一的测量方法是通过问题的观看次数。通过仅将统计信息限制为仅现有用户,您几乎可以在这里删除“线程”中的所有内容。
–影子向导正在接种疫苗
16年7月18日在11:33
另一方面,@ Sha认为!=有用,因此总票数可以更好地衡量有用的捐款数量。不过,那还不是“达到的人们” ...
–帕特里克·霍夫曼(Patrick Hofman)
16年7月18日在11:35
读完这篇文章,每个人似乎都在说“我想衡量人们的帮助”,但不知道为什么。所以我把这个扔了。我只限于注册用户是可以的,因为与保守的估计相比,我更喜欢保守的估计。但我理解所有观点。
–路迪
16年7月18日在11:38
因为信誉已经反映了获得帮助的用户数量。粗鲁地拿下您的声誉,然后将其除以10(不考虑接受和拒绝投票)。该统计数据远不止于此。
–帕特里克·霍夫曼(Patrick Hofman)
16年7月18日在11:40
@PatrickHofman很好,这是同样的问题。我认为可能多数是同一个人对我的支持。我认为我的选票分配得没有那么明显!
–路迪
16年7月18日在11:44
好的,好点@Ludi
–帕特里克·霍夫曼(Patrick Hofman)
16年7月18日在11:45
#30 楼
BogoMIPS(或类似的东西-BogoHelps?)会是一个更好的名称,因为它完全承认它是虚假的。
现在有更多的地面人在读SO吗?
评论
它从来都不是准确的。
–影子向导正在接种疫苗
16年1月6日在8:38
@ShadowWizard:然后给它一个名称,该名称表示尽可能多的名称。这就是我要说的。
–疯狂
16年1月6日在8:47
我敢肯定,许多人试图找到更好的名字并失败了,我并不期望能比所有人都更好。这在99%的情况下都有效,我真的不认为仅在数量很少的情况下,我们不应该将名称更改为复杂的名称。
–影子向导正在接种疫苗
16年1月6日在8:49
@ShadowWizard:这篇文章要求命名建议。这就是我的答案。 (我意识到现在已经晚了一年,因此如果没有大规模的支持,新的建议就不太可能被采纳,但是我仍然可以为这个问题提供一个有效的答案)。
–疯狂
16年1月6日在9:07
我知道,我从没说过别的话,也没有建议删除答案,只是解释了为什么我不同意这样的名字,以及为什么我没有自己的答案。
–影子向导正在接种疫苗
16年1月6日在9:11
@ShadowWizard:足够公平。
–疯狂
16年1月6日在9:18
我喜欢您的回答,但我更愤世嫉俗的一面会指出,OP是以特定包装销售SE。
–KorvinStarmast
19年1月7日在14:48
评论
健全性检查:因此,我发布了第73个问题的答案,并获得了100万次观看。一年后,它获得了5票。这是否意味着我帮助了100万人?@Mysticial,不!这就是为什么我们至少要寻求该名称的帮助。
匿名调查数据发生了什么? “这对您有帮助吗?”向未登录的用户显示的问题?还在使用吗?可以使用这些数据来加强此统计信息吗?
您能为我们提供一个Data.SE查询,让您计算任何站点上的数字吗?
我试过查询。 “超时到期。在操作完成之前超时时间已过,或者服务器没有响应。”
我不太确定我们是否需要此统计信息。现在,似乎有人在说:“哇,您正在帮助很多人!”但实际上,仅适用于该个人。为什么来自Google的任何随便的人都要关心我帮助了多少人?为什么要有人?如果我正在帮助很多人,那么很多人可能已经知道我的用户名,并且不需要数字来告诉他们。而且我们已经有声誉可以告诉某人是否正在生成有用的内容。
SE不是用来帮助人们的,如果可以的话,我要走了。删除。
@ bjb568那么SE的作用是什么?只侮辱人吗?只是想知道。
@ShadowWizard Stack Exchange用于构建有关特定社区主题问题的详细答案的库。
我认为您的标题为“您必须得到这个才能吸引我们”真正体现了SE对我而言的含义-我知道我会在一段时间内引用它-出色的写作!
我中有些人在想:“好吧,如果我发现最受欢迎的问题,答案不超过2个,并为每个问题写一篇好文章……”但是,如果您将帖子年龄与答案年龄包括在内,则很容易解决。这是一个简单的计算,您可能只需要为具有超过10k视图的帖子触发它。 AnswerViews = PostViews *(AnswerAge / PostAge)。
@ bjb568如果不帮助人们,建立详细答案库的目的是什么?
@Jefromi当然,图书馆是为了帮助人们。我的观点是,专注于帮助人们不会像创建一个有用的信息库那样好。创建有用的信息库注重质量。
我对此有一个基本问题。至少从“热门问题”侧栏开始,我们都知道,获得观点的不是好问题和答案,而是那些标题和/或内容浅浅的问题。我宁愿看到质量稳定的回报。 (无论用哪种方式衡量。)在任何情况下,仅基于视图的“对您有用”的统计信息-在大多数情况下忽略投票和匿名反馈-毫无意义。
我很好奇这似乎包含导致负面的匿名反馈(甚至是低票)的页面浏览量。弹出,阅读问题,发现问题令人困惑,单击向下箭头,不读其他内容就离开了-宾果游戏,您已经得到了三个回答者的帮助!