我关心的是,因为深度学习没有是否需要特征提取并且几乎不需要输入预处理,这会杀死图像处理(或一般来说是信号处理)吗?
我不是深度学习专家,但在直接拍摄图像而不是像其他技术一样使用特征向量的识别和分类任务中,它似乎非常有效。
是否存在使用图像处理技术的传统特征提取+分类方法会更好的情况,还是因为深度学习而垂死?
#1 楼
在此答案的顶部,您可以看到一部分更新的链接,其中,人工智能,机器智能,深度学习或数据库机器学习逐渐步入传统信号处理/图像分析/计算机视觉的基础。下面是原始答案的变体。对于一个简短的版本:卷积神经网络和深度学习的成功被看作是伽利略革命的一种。从实用的角度来看,经典信号处理或计算机视觉已经死了……只要您拥有足够或足够好的标记数据,而不必担心明显的分类失败(也就是深层缺陷或深层伪造),无需考虑碳足迹就可以进行测试的无限能量,也不必理会因果关系或理性解释。对于其他人,这让我们重新思考了之前所做的一切:预处理,标准分析,特征提取,优化(请参阅我的同事J.-C. Pesquet关于解决变分不等式的深度神经网络结构的工作),不变性,量化,等。因此,真正有趣的研究正在涌现,希望能赶上扎根的原则和类似的性能。
更新的链接:
2019/07/19 :边缘:如果您可以识别这些图像中的内容,那么您比AI还要聪明,或者您看到沉船残骸,枯叶上的昆虫吗?
2019/07/16:预印本:自然对抗性示例
我们介绍自然对抗性示例-真实,未修改, br />和自然发生的示例,这些示例会导致分类器准确性显着降低。我们整理了7,500个自然对抗示例,并在ImageNet分类器测试集中发布了这些示例,我们称之为
ImageNet-A。该数据集用作衡量分类器鲁棒性的新方法。像l_p对抗示例一样,ImageNet-A示例
成功转移到看不见的分类器或黑匣子分类器。例如,在ImageNet-A上,DenseNet-121的准确度约为2%,准确度下降约90%。恢复这种精度并不容易
,因为ImageNet-A示例利用了当前分类器中的深层缺陷
,包括它们过度依赖颜色,纹理和背景提示。
我们注意到,流行的训练技术改善鲁棒性
效果不大,但我们证明一些体系结构更改可以增强自然对抗性示例的鲁棒性。要对这种ImageNet硬测试集进行鲁棒的概括,需要进行进一步的研究信号处理和时间序列分析的前沿? “在本文中,我想展示信号或时间序列至关重要的几个领域”
2018/04/23:我刚从ICASSP 2018年度国际声学,语音和信号处理会议上回来。大量依赖于深度学习,深度网络等的论文而感到惊讶。四分之二的研究人员(由Alex Acero和Yann LeCun撰写)专门针对这一主题。同时,我遇到的大多数研究人员都在开玩笑(“对不起,我的海报在过滤器库上,而不是在深度学习上”,“我不喜欢它,我有小的数据集”),或想知道在挑战中获得0.5%的收益,并失去对物理或统计学先验建模的兴趣。
2018/01/14:深网能否看到猫?猫”倒立,绘制等,以某种方式在草图上产生令人惊讶的结果
2017/11/02:添加了对散射变换/网络的引用
2017/10/21:卷积神经网络的反问题回顾in
成像
深度学习及其在信号和信息处理中的应用,IEEE信号处理杂志,2011年1月
可以在底部找到有关标准信号/图像处理的深度学习参考“步进”。迈克尔·埃拉德(Michael Elad)刚刚写了《深度问题:深度学习对图像处理,数学和人类的影响》(SIAM新闻,2017/05),摘录:
然后神经网络突然回来了,
这个论坛很有趣,因为它显示了从传统的“图像处理”(试图对数据建模/理解)到正确领域的转变,而没有如此多的见识。
该领域的发展非常快。这并不意味着它会朝着某些有意或恒定的方向发展。对与错。但是今天早上,我听到以下话(或者是在开玩笑?):
有大量数据的不良算法比具有停顿数据的智能算法要好。
这是我很短的尝试:深度学习可能会提供最先进的结果,但人们并不总是能理解为什么,我们科学家的部分工作仍在解释为什么一切正常,数据的内容是什么,等等。
使用的深度学习也需要(巨大)标记良好的数据库。任何时候您对单个或单个图像进行手工处理(即没有背后的庞大数据库),尤其是在不太可能产生“基于用户的免费标签图像”的地方(在“有趣的猫在玩游戏和面孔”中的补充集) ,您可以坚持传统的图像处理一段时间,以获取利润。最近的一条推文总结道:
(很多)带标签的数据(没有丢失的vars)要求对于许多域来说都是一个交易破坏者(也是不必要的)
如果他们被杀死了(我会在短期内提出疑问),那么他们还没有死。因此,您在信号处理,图像分析和计算机视觉方面获得的任何技能都将在将来为您提供帮助。例如,在博客文章中对此进行了讨论:我们是否已经忘记了计算机视觉中的几何?作者:Alex Kendall:
深度学习彻底改变了计算机视觉。如今,
最好的解决方案不是基于端对端深度学习模型的,这已经不是很多问题。尤其是,卷积神经网络很受欢迎,因为它们往往开箱即用。我们对它们有很多不了解的东西。
一个具体的例子如下:在同一位置,需要评估其中一个是否包含应检测到的特定变化,这可能是传统图像处理的问题,而不是深度学习(截至今天)。
另一方面与大规模深度学习一样成功,它可能导致少量数据分类错误,这对于某些应用程序“平均”而言可能是无害的。可以通过DL对人眼略有不同的两个图像进行不同的分类。或者可以将随机图像设置为特定类别。举例来说,例如,深度神经网络很容易被愚弄:无法识别图像的高置信度预测(Nguyen A,Yosinski J,Clune J. Proc。Computer Vision and Pattern Recognition 2015)或深度学习是否存在深层缺陷? br />
研究人员应用了某些不可察觉的扰动后,网络可能会将图像分类错误。通过调整像素值以最大化预测误差来发现扰动。
在充分考虑“深度学习”的情况下,考虑“批量生产响应注册的”。 ,已知的,可大规模验证的或预期的行为”与“单个艺术品”。在单一指标范围内,没有一个更好(但现在)。两者可能必须共存一段时间。
然而,深度学习遍及许多新颖领域,如以下参考文献所述。深度学习可能会揭示许多非线性,复杂的功能,而传统处理以前是看不到的。
图像压缩的深度学习br />
实时自适应图像压缩,ICML 2017
带递归神经网络的全分辨率图像压缩,
端到端优化图像压缩,ICRL 2017,
深度学习视频压缩
深度学习可以应用于视频压缩吗?
用于降噪,恢复,去除伪像的深度学习
CAS-CNN:用于图像压缩伪像抑制的深度卷积神经网络
具有深度卷积足够统计量的超分辨率幸运的是,一些人正在尝试寻找深度学习背后的数学原理,其中的一个例子是StéphaneMallat及其合作者提出的散射网络或变换,请参见ENS网站。散射。谐波分析和非线性算子,Lipschitz函数,平移/旋转不变性,对于一般信号处理人员来说更好。例如,请参阅了解深度卷积网络。
评论
$ \ begingroup $
使用适当修改的副本来补充不足的训练数据有助于深度学习的泛化。近来,已经找到了需要完整监督标记的方法:在半监督学习中,无监督数据扩充会自动为训练数据的未标记部分生成标签,并将其用于训练。 (请随意在答案中包含此信息或类似信息。)
$ \ endgroup $
–奥利·尼米塔洛(Olli Niemitalo)
19年7月20日在9:37
$ \ begingroup $
如果您知道如何“一致地”扩充。在古典数据集上还可以,但仍可以在我处理的科学数据(地质,化学)上走来走去
$ \ endgroup $
– Laurent Duval
19年7月20日在9:54
$ \ begingroup $
@Laurent,关于您所说的话:“我们的科学家工作仍然是在解释事情为什么起作用”:听起来数据科学对于somoeone来说是一个有效的职业,因为他们认真地致力于DSP。除了您听说过的典型“ DSP工程师”标题以外,还有其他名称吗?
$ \ endgroup $
– JFonseca
19年11月1日在22:03
#2 楼
首先,在图像处理或计算机视觉领域进行毕业研究并使用深度学习没有错。深度学习并没有杀死图像处理和计算机视觉,它只是这些领域中的当前热门研究主题。第二,深度学习主要用于对象类别识别。但这只是计算机视觉的许多领域之一。还有其他领域,例如对象检测,跟踪,3D重建等,其中许多领域仍然依赖于“手工制作”的功能。评论
$ \ begingroup $
小心:DNN能够很好地完成您提到的所有任务:对象检测,跟踪,3D重建等。也就是说,信号处理是对如何操纵信号的物理方面的洞察力,以及为什么我们应该以某种方式操纵它们-我相信那些将重新解释为什么像DNN这样的自适应算法起作用。但是请不要误会-DNN非常有能力进行从输入到所有目标目标(可微分)的基础转换。
$ \ endgroup $
– Tarin Ziyaee
16 Sep 14'3:23
#3 楼
今天我们和我的一个朋友进行了讨论。慕尼黑今天是一个下雨天,而欧洲大部分地区都充满阳光。人们在社交媒体上分享照片,他们穿着漂亮的夏装,在海洋中游荡。她对这种情况感到恼火,转过头问我:“您能写一个软件来阻止社交媒体上的图片吗?这些媒体包含夏天如此可爱的照片,而此时的天气却很糟糕?”我说,为什么不呢。您所需要做的就是收集大量夏季图像和负面示例,并通过网络进行馈送,该网络在“阻止”或“无阻止”级别上进行二进制分类。训练和调整网络。而已。然后,我转身对自己说:我真的知道如何编写一种简单的算法来确定天气是否晴朗,而又不让机器为我做思考吗?勉强...也许...对于好奇的读者,如果您想尝试以下功能,可能需要设计一些功能:
两类天气分类,CewuLu§Di Lin,贾佳娅,唐智强,CVPR 2014
很显然,如今我什至都不在乎这份CVPR出版物,只是深入探讨。因此,尽管我喜欢深度学习在许多情况下的强大性能,但我也谨慎使用它。即使它不会杀死我对图像处理的知识,它也会减少我所需的领域专业知识。从理智上讲,这不是很优雅。
只要个人决定让自己进入正轨并从两个世界受益,他都会站在安全的一面。
#4 楼
没有深度学习不会杀死图像处理。您需要庞大的数据集和大量计算资源才能进行深度学习。有许多应用程序希望能够以较少的计算负载和较小的内存占用空间进行图像处理,而又无需访问大型数据库。一些示例是手机,平板电脑,移动相机,汽车,四轴飞行器。如今,由于存在一些非常令人印象深刻的分类结果,因此深度学习备受关注。分类是图像处理所处理的众多问题之一,因此即使深度学习确实能够解决所有分类问题,也有很多其他类型的图像处理需要处理。降噪,图像配准,运动计算,变形/融合,锐化,光学校正和变换,计算几何形状,3D估计,3D +时间运动模型,立体视觉,数据压缩和编码,分割,去模糊,运动稳定,计算机图形学,各种渲染。
评论
$ \ begingroup $
去噪,3D估计等,您提到的所有内容都可以通过具有适当体系结构的DNN和适当的数据进行近似和求解。
$ \ endgroup $
– Tarin Ziyaee
16/09/14'5:27
$ \ begingroup $
是的,您可以每周在捷豹(Jaguar)购物(但这不是为什么要制造它们)。
$ \ endgroup $
–宏线程
16 Sep 14'9:47
$ \ begingroup $
嘿,是的-但这与说您不能使用美洲虎购物是不同的。
$ \ endgroup $
– Tarin Ziyaee
16 Sep 15'1:29
$ \ begingroup $
很容易对DNN难以解决的工程问题施加有用的约束。例如,约束条件是所使用的方法不应偏向特定的一组输入数据。然后,DNN当然会默认取消资格,因为它们都需要培训,因此会因使用培训数据而产生偏差。
$ \ endgroup $
–宏线程
16 Sep 15'在11:03
$ \ begingroup $
任何工程工具都是这样:但这不是重点。关键是,您上面提到的所有这些任务实际上都可以用DNN很好地解决。是的,有些是最近的发展,但是误以为不能用DNN解决!就这样!
$ \ endgroup $
– Tarin Ziyaee
16 Sep 15 '16:40
#5 楼
简短的答案是,不是。DL可以识别照片中的杯子,但这无论如何也不会终止信号处理。就是说,在这些困难的日子里,您的问题非常重要。在这里有一个很好的小组讨论主题,其中包括Stephane Mallat等。#6 楼
数据工程仍在机器学习中用于预处理和选择馈送到DNN的数据,以改善其学习时间和评估效率。仍然需要一种数据工程形式的图像处理(摄像头传感器和RGB /等位图之间的东西馈送到DNN)。#7 楼
对信号处理(以及线性代数,向量微积分,数学统计等)的透彻了解对于深度学习领域(尤其是计算机视觉)中的非平凡工作而言是不可或缺的。深度学习中的高影响力论文(现在已经摘取了大部分低落的果实),这意味着对信号处理概念有了很好的理解。
一些激励性概念:
卷积扩散:请查看此博文。对于在信号处理概念上扎根(哈)的人来说,第一个方程式就是吃牛油。它也与经典小波信号处理中的trous算法紧密相关。
转置卷积层/ Deconv层。同样,基本的信号处理概念也是如此。
转换滤波器的形状-需要对运算符范数和收缩映射有个好主意。通常可以在信号理论或控制系统的EE研究生课程中,或在分析(实际或功能)数学课程中找到它。 “……的吸引人的特性”将其形式化为扰动,并使用神经网络中各个层的Lipschitz常数和非线性来限制对此类扰动的敏感性。同意,该分析是非常初步的,但我再次相信,这证明了要使包括深度学习在内的任何事物取得非平凡的进步,都需要对平庸的理论理解。因此,即使您最终从事计算机视觉工作并对问题进行深入学习,信号处理背景也将使您很容易掌握。
评论
$ \ begingroup $
是的。不必学习要馈送到网络的内容的任何捷径都必须通过较差的性能来艰难地学习。
$ \ endgroup $
–宏线程
17年10月1日在9:09
#8 楼
我确实没有做太多图像处理,但是我上次在神经网络作为热门话题(80年代中期至后期)时曾在一家从事信号分类研究的组织(美国海军)工作。我必须坐在大量的营销方面。这些论点是这样的:它是神经的,就像你的大脑一样,由于它的性能优于线性分类器,因此它优于统计技术。我实际上知道有些人因为使用统计数据评估绩效而拒绝了他们的论文。
神经网络是归纳的,如果他们的训练集中没有或只有几个例子,他们就可以正确地对事物进行分类。工作,我们都知道DARPA所做的一切都是赢家。(谷歌还没有出现)
表现不是很好,不需要混淆矩阵,不需要先验课程,我可以告诉你我出错的概率是多少。不需要限制,我只需进行一次伸出并重新训练随机播放。
选择一些功能并继续使用它,它是一个黑匣子,缩放,数据对齐,杂乱剔除,不良标签,出现多个类,不是我的问题。
数学的迷雾,玻尔兹曼机器
让我们投入SVD,也许是分形维数。
有监督/无监督的诱饵和开关,我将找到所有隐藏的模式。这种联想记忆不是很深刻吗?
毕晓普的书改写了我的冷嘲热讽。
在许多应用中,最佳信号处理算法将需要在较大的参数空间上进行详尽的枚举搜索,而该参数空间很快变得难以处理。大型服务器场可以增加可实现的搜索空间,但是在某些时候,您需要找到一种启发式方法。 DL似乎能够找到其中的一些启发式方法,但无法解决底层的NP硬优化。
评论
$ \ begingroup $
镇压犬儒主义完全正确,因为它似乎使很多人失望。有时我希望我早年学到这一点。
$ \ endgroup $
–宏线程
17-10-26在21:34
#9 楼
从大学的角度来看,我认为许多信号处理人员对ML有点敌意,因为他们感到威胁说它正在蚕食他们的领域。但是最近对复杂价值的深度神经网络的好处进行了很多研究,这可能表明金票确实对这两个学科都有了扎实的理解。评论
$ \ begingroup $
是的。信号处理与机器学习密切相关。对信号处理的深入了解有助于理解如何构建和使用ML算法,以及(不)适合提供什么样的数据。
$ \ endgroup $
–宏线程
18年7月1日在10:49
评论
重新打开此选项是因为它具有很高的赞成票数,而票数最高的答案也有很高的赞成票数。@LaurentDuval我认为每个答案都很有帮助,也很有趣,但主要是您和与线程有关的人(以及随后的讨论)确实阐明了这个话题。
我想在正在进行的讨论中取得一个十字路口。谁说深度学习不需要特征提取?以我自己的实际经验,我们不应该为原始数据训练DNN。我们必须进行一些特征提取,还必须对图像有一些基本的了解。深度学习应该谨慎使用,但这也是一个好主意。