我只是在学习图像的频域。

我能理解波浪的频谱。它表示波中存在哪些频率。如果我们绘制$ \ cos(2 \ pi f t)$的频谱,我们将在$ -f $和$ + f $处获得脉冲信号。而且我们可以使用相应的滤波器来提取特定信息。

但是频谱在图像情况下意味着什么?当我们在OpenCV中对图像进行FFT运算时,会得到一张奇怪的图片。该图像表示什么?它的用途是什么?

我读了一些书,但它们提供了许多数学方程式,而不是物理意义。那么,谁能在图像处理中简单应用频频域,就对频域进行简单的解释呢?

评论

理解变换的最佳方法是将简单的输入馈入逆变换。

另请参阅史蒂夫·埃丁斯(Steve Eddins)的有趣解释,blogs.mathworks.com/steve/2009/12/04/…

@endolith是的!您需要事先了解领域的知识才能完全了解正在发生的事情以及发生的原因。
亲爱的图像频域代表相对于Hertiz中特定频率的功率强度(瓦特),例如(直流分量,低频和高频)

#1 楼


但是频谱在图像情况下意味着什么?


“数学方程式”很重要,因此不要完全跳过它们。但是2d FFT也具有直观的解释。为了说明起见,我计算了一些样本图像的逆FFT:



如您所见,频域中仅设置了一个像素。图像域中的结果(我只显示了实部)是“旋转余弦图案”(虚部将是对应的正弦)。

如果我在频域(在左边界):



我得到了不同的2d频率模式。

如果我在其中设置了多个像素频域:



得到两个余弦的和。

就像一维波,可以表示为一个和如上所示,对于正弦和余弦,任何2d图像都可以表示为(松散地说)“旋转的正弦和余弦”。


当我们在opencv中拍摄图像时,会得到奇怪的图像。该图像表示什么?


它表示正弦/余弦的振幅和频率,相加后将得到原始图像。


它的用途是什么?


实在太多了。使用FFT可以非常有效地计算相关性和卷积,但这更多的是优化,您不必为此而“看” FFT结果。它用于图像压缩,因为高频分量通常只是噪声。

评论


$ \ begingroup $
可以指定频域图像中哪个是高频部分,哪个是低频部分吗?
$ \ endgroup $
– Abid Rahman K
2012年3月6日下午16:40

$ \ begingroup $
@arkiaz:在我显示的图像中,最高频率位于图像的中心,最低频率(即输入图像的平均值)是FFT结果中的左上方像素。这就是大多数FFT实现所提供的。如果显示FFT结果,通常会将最低频率移到显示图像的中心。
$ \ endgroup $
– Niki Estner
2012年3月6日17:50

$ \ begingroup $
@Mohammad:我使用了Mathematica的InverseFourier函数。八度/ matlab的ifft2是否也一样?
$ \ endgroup $
– Niki Estner
2012年3月7日在7:21

$ \ begingroup $
@JimClay对于彩色图像,我实际上建议使用YUV域。 Y =绝对强度,UV =颜色。即使对于彩色图像,您感兴趣的大多数信息也都在图像的强度部分。您使用所有相同的数学工具,只是记得要转换回来。
$ \ endgroup $
– Atav32
2012年6月22日18:34

$ \ begingroup $
这些将非常适合作为动画,例如移动点并显示波浪如何改变宽度和角度
$ \ endgroup $
– Endolith
2014年5月9日20:11

#2 楼

我认为这在众所周知的“ DSP指南”(第24章,第5节)中做了很好的介绍:


傅里叶分析在图像处理中的使用方式与<一维信号。但是,图像没有在频域中对其信息进行编码,从而使该技术的实用性大大降低。以
为例,当对音频信号进行傅立叶变换时,令人困惑的
时域波形将转换为易于理解的频谱。

相比之下,对图像进行傅立叶变换会将空间域中的直接信息转换为频域中的加扰形式。简而言之,不要指望傅里叶变换可以帮助您
理解图像中编码的信息。通过对典型图像进行DFT(例如下面的示例)获得的随机模式,但它并不是人脑准备直观理解的形式,至少与视觉感知有关。



这是图像的傅立叶变换中包含的内容以及如何解释的另一种有趣且易读的说明。它具有一系列图像,可以很清楚地说明傅立叶变换后的图像和原始图像之间的对应关系。如何将图像的大部分感知上重要的信息存储在频率表示的相位(角度)分量中。

编辑2:傅立叶表示中相位和幅度含义的另一个示例:“德尔福特大学教科书“图像处理基础知识”的第3.4.1节“相位和幅度的重要性”非常清楚地说明了这一点:



评论


$ \ begingroup $
嘿!我尝试遵循您问题中的第二个链接(“另一个有趣且可读性强的博览会...”),但该链接无效。我也尝试了评论中提供的链接,但不起作用。您能在工作链接中找到并编辑吗?
$ \ endgroup $
–佩内洛普
2014年1月14日上午10:36

$ \ begingroup $
@penelope,您是第二位注意到链接问题的人(请参阅我之前的评论)。该页面似乎确实不稳定。如前所述,我将使用Web Archive版本替换该链接。感谢您指出了这一点!
$ \ endgroup $
–waldyrious
2014年1月16日,下午3:47

$ \ begingroup $
实际上,(最终有效)链接上的示例和说明很棒:)
$ \ endgroup $
–佩内洛普
2014年1月16日上午8:58

#3 楼

波$ f(t)= cos(ωt)$是一维波;它仅取决于$ t $。波$ f(x,y)= cos(ωx+ψy)$是二维波。它取决于$ x $和$ y $。如您所见,在两个方向上都有两个频率。

因此,$ cos(ωx+ψy)$的傅立叶变换(FFT)将为您提供$ω,ψ$,就像$ cos(ωx)$的FFT为您提供$ω$。如果您输入的是一个将2D余弦求和的函数,则您的2D FFT将是这些余弦的频率之和-还是1D FFT的直接模拟。

#4 楼

可能值得注意的是,傅立叶分析是称为正交函数的概念的特例。基本思想是将复杂的信号分解为简单的“基本”函数的线性叠加。您可以对基本函数进行处理或分析,然后对基本函数的结果求和以获得原始信号的结果。基函数,即它们理想地形成正交基。在傅里叶变换的情况下,基函数是复指数。但是,还有许多其他功能也可以用于此。

评论


$ \ begingroup $
没错。还有哪些其他类型的基函数?我在考虑daubechies小波,但是还有其他小波吗?有什么区别呢?
$ \ endgroup $
–太空
2012年3月8日23:39

$ \ begingroup $
也许最著名的是多项式;函数作为一组多项式的表示形式称为其泰勒级数。从函数导数可以很容易地计算出这个序列。
$ \ endgroup $
– MSalters
2012年9月9日,9:22

$ \ begingroup $
查找基本函数的一种方法是应用主成分分析。产生的“本征图像”通常比sin / cos函数具有更直观的外观。有关示例,请参见本征面。频域仍然与感知有关(我们的眼睛/大脑具有对频率敏感的边缘检测器,尤其是在涉及运动时);基本功能作为图像只是没有什么意义。
$ \ endgroup $
–丹·布莱恩特
13年5月16日在13:40

$ \ begingroup $
PCA是一种很好的基础计算技术,已被广泛理解,但是还有许多其他方面对数据的生成方式有不同的假设。独立成分分析(ICA)是一个受欢迎的示例。在更远的地方,存在使用稀疏编码进行通用基函数学习的算法(例如,J Mairal等人,“稀疏编码的在线词典学习”,ICML 2009),然后是由深网开发的“特征学习”方法乡亲
$ \ endgroup $
–lmjohns3
13年8月22日在22:17

$ \ begingroup $
为什么函数必须正交?
$ \ endgroup $
– Quantum231
2014年9月27日20:39在

#5 楼

在图像中,频率增加与亮度或颜色的更突然转变相关。此外,噪声通常嵌入频谱的高端,因此可以使用低通滤波来降低噪声。

评论


$ \ begingroup $
所以您的意思是有时突然转变会被视为噪音?
$ \ endgroup $
– Abid Rahman K
2012年3月7日14:53

$ \ begingroup $
是的,有时候。常见的例子包括蚊式噪声(在边缘周围响起),宏块边缘的JPEG块噪声,当然还有颗粒。考虑一个简单的渐变图像。通过在整个图像中引入微小的过渡,向该图像添加颗粒可以增加其高频含量。
$ \ endgroup $
–埃姆雷
2012年8月8日,1:12

#6 楼

在这种情况下,一个非常不错的演示:http://bigwww.epfl.ch/demo/basisfft/index.html

评论


$ \ begingroup $
不是(真的)答案,应该是评论。
$ \ endgroup $
– EdParadox
19年8月5日在15:15