我正在浏览垃圾邮件文件夹(由于Gmail很少有误报,所以我很少这样做),并且发现了一些有趣的事情:主题中至少有一个动画表情符号。

我的朋友都不会使用该废话。

我如何与之建立业务往来的有效公司也不会这样做。 br />使用下面的jamesmstone线索,我尝试使用subject:=?UTF-8?subject:"=?UTF-8?"以及其他几种排列进行搜索,但没有成功。
Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
       dkim=pass header.i=@mythirdxyz.xyz;
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>


评论

我不知道他们是否是goomoji ...

@jamesmstone:我希望是。

#1 楼

简短答案
而不是使用依赖于Gmail搜索功能的Gmail过滤器来搜索原始邮件中的编码表情符号,而是使用Google Apps脚本的GmailMessage :: getRawContent()方法创建脚本来处理邮件。
相关问题
以下是指向本网站中类似问题的答案的链接,包括使用引用方法的脚本。


如何根据中的信息设置Gmail过滤器标头?,于15年7月24日在6:07回答。 :28。


评论


值得一提的是,脚本无法完全删除邮件-最多可以将其移动到垃圾箱或垃圾邮件文件夹中。而且,如果此类邮件已经成为垃圾邮件,则该脚本几乎没有好处。

–user79865
16 Jan 29'14:23



@Minestrone:实际上,可以使用脚本完全删除一条消息。它应该使用Gmail API。请参阅developers.google.com/gmail/api/v1/reference/users/messages/…。要在Google Apps脚本中使用Gmail API,请参阅developers.google.com/apps-script/guides/services/advanced。

–鲁本♦
16年1月29日在14:58



我对真正删除邮件的兴趣不大,因为我正在寻找一种过滤邮件的方法。我可能只是想给他们贴上标签。

–ale
16年1月29日在20:28

@AlE。我以为是这样,所以我没有在答案的正文中提到使用GMAIL API。另一方面,幸运的是,我没有收到主题中带有表情符号的电子邮件。

–鲁本♦
16年1月29日在20:38



#2 楼

我为此目的创建了一个Google Apps脚本。

它在Github上:https://github.com/spamzero/spamzero

它可以让您创建各种您可以将其与垃圾邮件文件夹匹配的高级规则,因此,绝对是垃圾邮件将被自动清除。

评论


如果您包含脚本的简短说明,突出说明它将如何帮助处理主题中带有动画表情符号的消息,则答案会更好。

–鲁本♦
16-3-14的1:13

我同意@Ru​​bén,越多的信息越好。由于它可以使读者审查答案的可行性,而不必跳过太多的麻烦。

– Michelfrancis Bustillos
16-3-14在2:02



感谢您的脚本!有时,最有用的解决方案是减少诸如动画垃圾邮件之类的日常烦恼的解决方案。我建议为Google Apps脚本快速入门将此链接添加到Github自述文件,以便对使用脚本没有任何经验的用户知道如何启用Gmail API和查看日志。

– dan
18年6月6日在4:28

#3 楼

这并不是您所要的(过滤表情符号本身,而不是过滤带有表情符号的消息),但是您可能会发现一些内容对于构建更好的消息过滤器很有用。

现在有一个开源的Greasemonkey / Tampermonkey / Violentmonkey用户脚本摆脱了那些令人讨厌的视觉蟑螂(只是角色,而不是消息本身):
查看该脚本的来源,您会发现在滥用营销者的电子邮件(可悲的是,如今包括eBay和Amazon)中可以找到两种常见的表情符号蟑螂:


基于HTML图像的蟑螂(包括恐怖的动画蟑螂)又称goomoji
Unicode蟑螂:仍有许多表情符号(以及其他生成图片的Unicode序列),垃圾邮件制造者和其他以前的营销人员已开始在电子邮件主题中使用行,并且该gmail无法转换为HTML图像。在某些浏览器中,这些显示为粗体和彩色,几乎与动画一样糟糕。浏览器也可以选择对它们进行动画处理,但是我不知道是否可以这样做。这些Unicode序列在浏览器中显示为Unicode文本,因此确切的外观(是否有颜色,是否有动画……)取决于浏览器所使用的文本呈现系统。给定Unicode表情符号的外观还取决于在Unicode代码点序列中出现在其附近的任何Unicode变体选择器和表情符号修饰符。与基于图像的表情符号垃圾邮件不同,这些序列可以作为Unicode文本从浏览器复制粘贴到其他应用程序中。

对于后一种类型,用户脚本包括一个正则表达式,用于捕获可能被营销人员滥用的Unicode序列。 regex在ES6 Javascript中看起来像这样(用户脚本使用令人惊叹的ES6 Regex Transpiler将其翻译为广泛支持的ES6之前的正则表达式):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam