StackOverflow的垃圾邮件过滤器出了什么问题?最近,与足球流有关的大量垃圾邮件主题。它们都已被标记为垃圾邮件并被删除,但是所有时间都在发布,我几分钟前刚刚标记了另外6个。这已经进行了大约3天,这些主题不断在nfl标签中一遍又一遍地发布。



评论

垃圾邮件很烦人,而且它们一遍又一遍...无生命的垃圾邮件发送者,ba。

“使用垃圾邮件过滤器是否存在问题”:不,您似乎工作得很好;)

该死的我们有NFL标签吗?

垃圾邮件过滤器(即用户标记)对我来说似乎还不错:)我在mod队列中看不到任何数量的标记,因此你们确实很快将它们淘汰了。

@animuson:我正要问同样的事情;为烧伤提名,也许吗?还是有人问一个仅标记为“ NFL”的问题,而该问题已被删除并被列入IP黑名单?

@ani将所有垃圾邮件保存在一个易于查找的位置。

@BadWolf-有一些自动阻止已知垃圾邮件的方法,但是必须加以维护并且可以避免。

请不要自动阻止它。我想在这里标记妓女。

我很好奇现在他们没有NFL标签可以玩了...

@animuson现在标签消失了,他们无能为力! Chefmonsta.com/wp-content/uploads/2012/02/mini_me.gif

这不是最近,那个家伙已经参加了几个月。他们似乎擅长解决垃圾邮件过滤器并跟上发展。

老兄,我会错过所有令人讨厌的乐趣吗?!

再次,使用链接缩短器解决此垃圾邮件的URL黑名单使我在这里质疑其实用性。

@ psubsee2003-标签似乎合法。由于垃圾邮件,我前几天正在查看。大约有6个问题用nfl标记,有几个询问足球API。我打算在此处发布建议删除该标签的信息,但是我想起了Sudoku上的讨论,在该讨论中并未删除该标签。

@chue x:由于没有问题,它将在第二天自动删除。但是,它与数独并不相同:没有人正在编写程序来运行NFL,并且您认为这是不必要的是对的。如果有一个官方的NFL Data API,那么nfl-api或类似的东西会很好,但是标记为:“获取NFL游戏的时间表数据”:nfl就像标记为:“获取世界数独锦标赛得分”:sudoku的含义您要获取的数据几乎肯定与技术问题无关。

#1 楼

我们正在努力使这一点变得更好。该问题影响所有看到任何流量的网站,其中一些比其他网站更多。我不能讲太多细节,因为坦率地说,目前还没有很多细节属于达成共识的实现。

.....

我们过去犯的一个大错误是,在采取破坏性行动时,并未充分利用来自主持人和社区的信号。我们知道主持人何时销毁或删除帐户,但我们不知道他们为什么这么做,至少不以编程方式。在实施过程中进行的更改现在通过做一些了不起的事情来跟踪它,我们实际上是在要求他们指出采取该措施的原因。

实施此功能后,我们可以更轻松地在网络上进行查询,以更好地可视化这些傻瓜在站点之间移动,偶尔更改来源。这样一来,他们在自动应对和制止这类垃圾邮件泛滥时,无意间遗留下来的数据就会变得更加有价值。

这是一个小技巧,我们不想阻止任何人阅读我们的网站,甚至写得不好的Perl机器人也应在生命中赢得战斗的机会。尽管如此,我们对接收的内容还是会有些挑剔,尤其是当我们对远程主机的近期行为有了更清晰的了解时。我不打算介绍一些我还不需要提供的细节,但这是我们正在认真考虑的问题。

其中一个(收集原因)应该尽快出台,那么我们需要一些时间来获取数据。

这不是我们实现此目的的唯一原因,当有人问他们为什么被删除时,与主持人一起播放聊天标签以获取上下文是次优的。但这将使我们更清楚地了解正在处理的内容。

更新

现在需要推销需要销毁帐户原因的功能,并将很快启用。为了透明起见,下面是界面(单击图像可获得完整分辨率):



如您所见,某些原因在跟踪方面比其他原因更有趣重复滥用,因为现在正在捕获额外的信号。鉴于某些网站看到的废话很多,不久我们就会有足够的数据来确认/发现模式。

评论


这太棒了!当然,这是一个简单的想法,但是巧妙地执行了。用户界面看起来经过深思熟虑,每个人都喜欢数据。除了垃圾邮件发送者。

–科迪·格雷
13年8月12日在8:03



在上面的评论中,有人写道“编辑垃圾邮件是个坏主意(重置垃圾邮件计数器)”。如果标记在编辑时确实已重置,则请注意将其编辑为“垃圾邮件帖子是否应被编辑?”,以使其也成为该官员?

– Arjan
13年8月12日在9:29



@Arjan我将与Jarrod进行检查,以查看垃圾邮件标志的管道中仍可能有什么变化,它们周围还存在一些最近的UI异常,因此一旦我确定我是对的,我将回答。

– Tim Post
13年8月12日在9:43

-1 for Comic Sans:P

–美国卢克
13年8月12日在13:54

明确地说,编辑不会使垃圾邮件标志无效-回滚已编辑的帖子会删除在编辑之后添加的标志@Arjan。我已经编辑了该帖子以进行澄清。不编辑明显偏离主题的垃圾邮件的最佳原因仅仅是因为它使查找和删除垃圾邮件更加困难。

–Shog9
13年8月12日在14:33

@TimPost刚刚在垃圾邮件发送者上使用过。谢谢。

–mpdonadio
13年8月12日在16:13

@American Luke:连漫画都没有。

– BoltClock是独角兽
13年8月14日在9:53

@ BoltClock'saUnicorn在此分辨率下看起来像:P

–美国卢克
13年8月14日在12:06

当主持人销毁另一个站点上的帐户时,我希望在我的站点上被标记。如果有人查看stackexchange.com/users/3208723/user2709183?tab=accounts,您会看到一种垃圾邮件,这种垃圾邮件会将销毁操作传播到存在链接帐户并且至少发布过一次的所有站点,这将加速清理直到过滤器可以调整。

–bmike
13年8月23日在18:08

已经有一段时间了,我很想知道你到目前为止发现了什么模式...?

–塔林东
2015年2月1日于1:24

关于占位符是什么的全部解释……

–bjb568
2015年5月12日,凌晨3:01

#2 楼

我已决定从根本上解决问题,关闭垃圾邮件博客本身。

这里的秘密是使用site:blogspot.com watch football之类的查询(此处使用的site:运算符将搜索限制为blogspot.com域)上,单击并检查所有可疑的结果,然后将每个垃圾邮件博客的URL粘贴到“ Blogger上的垃圾邮件,网络钓鱼或恶意软件”页面的报告表单中。

几个月之前,我只是这样做,并设法关闭了大约30个此类垃圾邮件博客,其中大部分是关于拳击的。如果您这样做的话,这很可能会引起Blogger员工的注意,使他们更有可能对这些Blog的操作者采取法律或其他行动,因为它们可能只由少数人管理。

您会经常发现这些垃圾博客包含独特的短语,例如:


“非常欢迎您观看”
“在线直播”
>“非常接受”
“您可以轻松观看”
“高清质量(HDQ)”

这些垃圾邮件博客也可能使用独特的图像,例如此Google按图片搜索查询中的一个。通过以上查询,我已经确定并报告了200多个垃圾邮件博客。

这些博客中的帖子通常包含一长串相关术语,例如“直播,直播,播送,直播,直播网络直播,高清直播”。这种高度进取的SEO旨在使搜索结果中的合法网站超载,并且是垃圾邮件的明显标志。作为关于他们如何推动SEO的一个示例,我在一个网站上发现了这一点(以破坏性的方式显示,以免造成破坏):


橄榄球,橄榄球直播,橄榄球直播免费,橄榄球直播,橄榄球直播免费,橄榄球直播在线,橄榄球直播免费,橄榄球直播在线这里,橄榄球,橄榄球直播,橄榄球直播免费,橄榄球直播,橄榄球在线免费直播,橄榄球在线直播,橄榄球在线直播免费,橄榄球在线直播现在在这里,免费橄榄球,免费橄榄球直播,免费橄榄球直播,免费橄榄球在线直播,免费橄榄球在线直播,免费橄榄球在线直播,免费在线橄榄球直播,免费橄榄球,免费橄榄球直播,免费橄榄球直播,免费橄榄球在线直播,免费橄榄球在线直播,免费橄榄球在线,免费橄榄球在线直播


的当然,我也会在Stack Exchange上标记显然也是垃圾邮件的任何帖子。

如果您尝试我在此答案和评论中建议的搜索,您会发现其中许多博客都是现在消失了:



评论


这太棒了。这样加根,可以使Internet变得更美好。

– Tim Post
13年8月12日在5:34

@TimPost:google.com/…–报告了40多个博客。我可以整天做这件事...

–bwDraco
13年8月12日在6:37

google.com/…(对不起,以前的链接搞砸了)

–bwDraco
13年8月19日在13:20

顺便说一句,你是我的英雄。

–安德鲁·巴伯(Andrew Barber)
13年8月19日在13:45

@AndrewBarber通过一些代表展示它!哦,等等,Mat已经做到了...;)

–影子向导正在接种疫苗
13年8月19日在14:05

@ShaWizDowArd嗯...是的;使用我从“撤销”获得的所有帖子中获得的一些代表是一件好事;)

–安德鲁·巴伯(Andrew Barber)
13年8月19日在14:07

这是后代的赏金通知:“真棒Fiery Dragon SPAM猎人真棒。” –垫i.stack.imgur.com/nqMy2.png

–bwDraco
13年8月19日在20:21

如果Google在销毁博客的同时删除了搜索结果,那就太好了。

–user102937
13年8月19日在21:26

我自己也来了这个答案,来这里发表它:-)谢谢。

– Preet Sangha
13年8月24日在22:50

学术界的一位主持人已引用此帖子来处理类似的垃圾邮件问题。 meta.academia.stackexchange.com/questions/903/…

–bwDraco
2014年4月24日14:35

就采取主动方法而言,这是一个很好的解决方案,尽管其中一些搜索词显示了超过1,000,000个结果。如果我们求助于手动标记,将需要大量的资源和精力。由于存在大量垃圾邮件,因此Google可以自己通过定期运行这些查询来减少此类垃圾邮件,或者我们应该建立一个公共论坛,在这些论坛中可以列出这些链接,以便google等博客采取行动,或者搜索引擎应发展以学习垃圾邮件行为。

–pal4life
14年4月29日在16:05

我不能开玩笑说在您提到的SEO标签中放了多少clickbait YT视频和虚假网站。 :/

– Zackary
18年8月26日在0:07



#3 楼

垃圾邮件并不新鲜。从12月/ 1月开始,Drupal Answers受到了很大的打击。其他站点也有问题(问Ubuntu)。 SE团队在使用自动过滤器方面做得非常出色,但是垃圾邮件的发展相当频繁,因此自动拦截不会长期有效。

正确的做法是将帖子标记为垃圾邮件。三个垃圾邮件标志会将其从首页删除,六个将其删除。不要编辑,不要低票,不要使用其他标志。标记为垃圾邮件并继续。

如果mod在自动删除之前看到该垃圾邮件,则他们可以销毁该帐户,并从该帐户中删除所有垃圾邮件。

评论


+1表示添加垃圾内容,但不做其他任何事情!实际上,这会影响内容的删除速度!

–安德鲁·巴伯(Andrew Barber)
13年8月11日在22:49



我知道编辑垃圾邮件是一个坏主意(重置垃圾邮件计数器),但是为什么要对其进行否决呢?

–Richard Tingle
13年8月11日23:25



@RichardTingle拒绝投票可能意味着更少的人看到垃圾邮件,因此它最终会有更少的垃圾邮件标志,因此它实际上停留的时间更长和/或没有足够的标志来自动删除。

–mpdonadio
13年8月11日在23:34

为什么在自动删除不足的情况下不使用自定义标志?

– John Dvorak
13年8月12日在9:17

@AndrewBarber-但是,无论如何,如果垃圾邮件是从帖子中删除的,那么它就不会迅速解决的问题就更少了。在速度较慢的网站上,可能需要半天才能删除垃圾邮件。当然,最好不要在这段时间内包含促销内容,从而使垃圾邮件毫无意义。

–马丁·史密斯
13年8月12日在10:34

@JanDvorak垃圾邮件标志在标志队列中具有更高的优先级。除非将其他人清除,否则他们可能看不到自定义标志。

–mpdonadio
13年8月12日在10:39

@MartinSmith在处理标志时,这意味着我们需要仔细阅读编辑历史记录以验证标志是否正确。这将导致mod的更多工作。

–mpdonadio
13年8月12日在10:44

@MPD在速度较慢的网站上,我无法想象这将是一个巨大的问题。我怀疑他们仍然会得到这么多的旗帜。最好从帖子中删除垃圾邮件,并为主持人创建少量其他工作,然后将其保留在那里一天。如果垃圾邮件发送者看到它可以生存那么长的时间,则显然是诱使他们更多地发送垃圾邮件的诱因。

–马丁·史密斯
13年8月12日在10:50

或者,也许(未处理)30分钟未处理的垃圾邮件标记应被推送到整个网络的垃圾邮件队列中,以便其他站点的主持人可以对其进行处理。在只有几个主持人的网站上,不太可能会有24/7主持人报道。

–马丁·史密斯
13年8月12日在11:19

@Richard,关于使标志无效,并不完全准确。参见Shog9的评论。

– Arjan
2013年8月12日14:34



主持人为什么不能在删除后核销该帐户? (至少那是听起来的样子)

–科尔·约翰逊(Cole Johnson)
13年8月17日在15:35

如果@ColeJohnson的声誉不太高,主持人可以随时销毁该帐户。如果我们发现一个帐户中有垃圾邮件标记,我们将其销毁,并自动删除关联的帖子。

–kiamlaluno
13年8月21日在1:17

@kiamlaluno为信誉定义“太高”,为什么您不能删除信誉“太高”的帐户?

–科尔·约翰逊(Cole Johnson)
13年8月21日在1:29

@ColeJohnson只有信誉低于500的帐户才能被销毁;其他可以删除。区别在于,在第一种情况下,该帐户创建的帖子全部被删除;在第二种情况下,仅删除得分为负的帖子,而对其余帖子进行非规范化。销毁功能已被禁用,因为信誉至少为500的用户可能对该站点做出了积极贡献,并且当分数不为负时,不应自动删除其帖子。

–kiamlaluno
13年8月21日在1:43



@MPD,也就是说,您是说我们应该反对垃圾邮件吗?

–起搏器
2015年4月25日23:31