.
替换为文本dot
并将@
替换为文本at
。我认为这样做的原因是,这种自动电子邮件收集机器人无法轻松匹配您的地址。我仍然看到使用此工具的更新网站。但是,使用程序解决此问题并不是很困难,并且已经有十多年了(截至2013年)。从事电子邮件收集工作的每个人都有足够的时间来更新其所有机器人以进行处理。仍然有不能解决这个问题的机器人吗?为什么?
今天还有什么理由要使用这种修改方法?
#1 楼
要了解这一点,我们必须了解爬虫如何找到电子邮件。在避开技术知识的同时,基本思想是这样(今天的算法当然比这更聪明):在页面中找到
@
。是否有一个在
@
之后的255个字符内加点吗?抓住
@
后面的内容,直到到达空格或行的开头。抓住
.
及其后面的内容,直到到达@
。抓住
.
之后的内容,直到到达行的末尾或空格为止。最直观的对策是告诉爬虫@
实际上是at
。好吧,这不是那么简单。请输入以下文字:我们爬到阁楼上,发现了一块点缀的木头。请给我们发送电子邮件:gmail.com的adnan。
现在让我们在其上运行新的搜寻器。首先在
.
中找到dot
,然后在at
中找到@
。生成的电子邮件为at
,然后它将找到第二封电子邮件attic
。然后,垃圾邮件发送者开始教爬虫如何查找某些域,忽略空格,考虑空格,考虑某些域名等。然后我们开始使用图像,垃圾邮件发送者使用OCR。我们开始使用JavaScript技巧,插入评论,URL编码等,并且垃圾邮件发送者总是找到解决这些问题的方法。
话虽如此,最基本的技术通常会产生足够好的结果(显然,在世界上的某个地方,这种联系是NSFW。我个人不同意),并且更加模糊,您可以获得更好的结果。
因此,直接回答您的问题:在公开文本的电子邮件地址中使用“点”和“在”仍然有用吗?是的,我认为至少在某种程度上是这样。但是这个解决方案已经存在了很长的时间,足以让我们假设一些爬虫已经找到解决方法。
我的建议是什么?请使用一些高级幻想,或仅使用图像。
评论
我无法想象收集电子邮件地址的人不知道被混淆的地址更可能属于不太可能回答垃圾邮件的人。
–Random832
13年11月6日在18:32
收集电子邮件地址的人正在将其批量出售给垃圾邮件发送者。数量意味着利润。质量由布尔测试决定:SMTP服务器是否不拒绝发送到该地址的电子邮件?无需担心“此人可能会做出回应吗?”
–约翰·迪特斯
13年11月6日在18:55
为了保护您的自行车免遭小偷的侵害,您不需要坚不可摧的自行车锁;您只需要使其比其他大多数自行车锁更坚固即可。您提供的图形显示了同样的原理。
– PLL
13年11月6日在21:03
这个答案是一颗真正的宝石,但是呈现的图像(图表)确实让我很受伤。我无法想象(相信),使用at而不是@并使用点代替。与使用Javascript,HTML实体和Urlencode相比,可提供更好的结果(收到的垃圾邮件更少)。这里一定有一些错误,否则我会丢失某些东西/弄错了什么。只要我一直在阅读有关垃圾邮件的信息(过去十年),就一直说垃圾邮件发送者首先采用了有问题的方法。那么,它们又如何比像Javascript这样更复杂的代码更好呢?
– Trejder
13年7月7日13:12
@Adnan:他们不能只搜索gmail或其他常见域,而不是搜索@吗?这样甚至可以远程找到任何东西,例如名字[dot]姓[我认为我很聪明] gmail [ooh yeah] com ...
–user541686
2014年8月16日10:41
#2 楼
以我的拙见,电子邮件混淆(任何形式)是有史以来最糟糕的想法之一。对于任何基于Web或任何其他用户界面的用户,最重要的问题是用户的便利性和安全性。 。垃圾邮件漫游器不是用户,因此它们不值得任何考虑或努力。
逻辑如下:
电子邮件混淆是对合法用户的滋扰。而不是简单地单击mailto链接,用户将被迫在其电子邮件地址提示中手动输入电子邮件地址。
1.a。即使是这样,也可能会阻止用户联系预期的地址-他们将前往其他地方,只是避免了繁琐的交互。
1.b.在此过程中输入错误但相似的地址,然后将可能重要的邮件发送到一些打错邮件的邮箱的机会非常高。
垃圾邮件发送者已经知道存在的大多数合法电子邮件地址。到目前为止,我遇到的每个邮箱(并且这是很多邮箱)都会定期收到一定数量的垃圾邮件。这就是所有现代邮件服务器和客户端都配备垃圾邮件过滤器集成的原因,在大多数情况下,垃圾邮件过滤器集成非常有效。
简而言之,只需使用普通的普通“ mailto:”链接,不要使用不必要地惹恼您的用户。
评论
哦,您仍然可以在模糊的fooÄTexampleDOTcom后面放置一个普通的mailto链接。有点无法达到目的,但是我已经看过很多次了,所以我必须得出结论,许多使用AT和DOT的人甚至都不知道为什么(或者根本不了解爬虫)。
–直线加速器
13年7月7日在9:14
直到几个月前,我才在个人地址上收到任何真正的垃圾邮件。可能有人或公司当时泄漏了我的电子邮件。每个合法地址都收到垃圾邮件肯定不是真的。
–user541686
2014年8月16日10:42
#3 楼
自从范式诞生以来,我从未理解过范式。我们只是在剥夺垃圾邮件防御软件所需的数据。如前所述,在解析器中添加“ at”“点”也是微不足道的。我实际上还是建议不要这样做。让地狱放松。使用您的电子邮件,然后使用任何电子邮件。我什至在10年前左右写了一个漫游器,它逐页生成无限随机的电子邮件。如果某个搜寻器将其击中,它将永远搜寻不存在的电子邮件。
我们不应该减少垃圾邮件机器人必须处理的电子邮件。我们应该增加数量,从而反过来增加资源需求,因此运行垃圾邮件发送者的成本会更高,而垃圾邮件在经济上变得不可行。
选择邮件服务时,应考虑垃圾邮件过滤器的质量因此,它们在获得经济利益的同时,垃圾邮件也不断受到损害。
我们今天拥有许多十年前还没有的工具。 DKIM,SPF,反向PTR,黑名单等。垃圾邮件的吸引力越来越小。我们应该向前推进。让它自己处理负载。
评论
有趣的主意。而且不一定非要非此即彼。可能两者兼有:混淆您的真实电子邮件地址,并将谷壳条放到垃圾邮件机器人上。
– LarsH
13年6月6日在22:42
....所以您是我收到带有多个“收件人”地址的垃圾邮件的原因,例如Izkata / Izkaya / Izkaa / Izkaat ....?
–伊兹卡塔
13年7月7日,下午3:57
完美的逻辑!让我们一起解锁所有自行车,这样,盗贼就很容易偷所有自行车,这将迫使他们停止偷自行车。现在,如果我们将其应用于Internet垃圾邮件,我相信它会起作用。我的意思是,让我们看一下其他广告方法,受众越多,他们越想停止广告。只需查看Google Ads,广播广告,电视广告,垃圾邮件等即可。
–阿迪
13年7月7日在8:39
@Adnan如果只售出一百万辆自行车中的一辆(因此点击了广告),那是小偷可以考虑的。因为他们会雇用一百万人只卖一辆自行车。
– Sedat Kapanoglu
13年7月7日在9:09
@adnan不,您正在用一堆两轮纸制纸质自行车包围自行车,并使您的真实自行车看起来像一堆零配件。骑自行车的小偷来抓住所有的纸m,不理你!我想我喜欢这个主意。
–TecBrat
2013年11月7日14:07
#4 楼
“在公共文本的电子邮件地址中使用'。'和'@'还是有用吗?”好,尽管回复如此,但我相当怀疑它是否有用,并希望电子邮件收割者能够甚至在人们天真地使用它之前就一直在扫描这种混淆(如果我在该游戏中,我当然会这样做)。
我们自己的测试还显示,垃圾邮件很快就到达了一个根本没有在网络上公开的电子邮件地址,很可能是从收件人的通讯录和受感染机器上的邮件文件夹;混淆电子邮件地址通常最多只会延迟不可避免的情况,而实际上并不能阻止它。
评论
要在YouTube评论中写URL,必须进行整理。 “ www.ninelivesrec.dev”变成“ vvv ninelivesrecs dev”。如果您的主要语言不是英语,例如拉脱维亚语,那么拉脱维亚语中的点就是朋克。我认为爬虫不会理解拉脱维亚语:)但这仅适用于小型语言。另外,如果电子邮件地址中包含数字,则可以编写:gmail punkts com上的email_two_(删除__,两个为2)
@Guntis Crawler是复杂的机器人!基本的翻译知道这一点!因此,对于样本而言,使用REGEX =(dot | punkt | point | pnt |точка|)很容易。然后机器人甚至可以通过再次使用语言识别来适应这种情况...