我试图了解如何以及为什么在图像处理/计算机视觉中使用傅立叶变换。以下是我到目前为止收集的内容。我对它的理解正确吗?如果没有,有人可以用简单明了的英语向我解释吗?或者,是否有人要添加任何内容?最后但并非最不重要的一点是,有人可以解释“离散傅立叶变换”吗?

傅立叶变换将图像分解为正弦和余弦分量。简而言之,正弦和余弦分别是从最小和最大开始的波。在现实世界中,我们无法确定观察到的波浪是在最大点还是最小点开始的,因此我们无法真正区分两者。因此,正弦和余弦简称为正弦波。

将FT应用于图像时,我们将其从其空间域转换为“频域”,本质上是将FT表示为图像随时间变化的颜色和亮度变化的术语(不是时间,而是空间。也就是说,在多个像素上)。

编辑:为什么要使用傅立叶变换?与其他方法相比有什么好处?例如,文献中的一种应用是形状识别或噪声消除。从根本上讲,如何利用FT进行形状识别?

评论

这是一个实际的应用程序(如果过时的话):使用FFT高效地计算图案和图像之间的归一化互相关,用于跟踪(或者如何使它们在《 Forrest》中与Tom Hanks聊天)阿甘”):idiom.com/~zilla/Papers/nvisionInterface/nip.html

嗯,对不起,您能详细说说吗?我不太了解:)

您问:“为什么要使用傅立叶变换?”,我给了您一个真实的示例,其中使用了快速傅立叶变换来加快归一化互相关的计算,以跟踪电影序列中的特征。该算法最初用于制作“阿甘正传”,请阅读本文以了解详细信息。

这可能对您有用。

实际上,傅里叶变换将信号分解为复杂的指数,因此它可以测量每个点的幅度和相位,但这也许比有用的方法更令人困惑。 :D dsp.stackexchange.com/a/449/29

#1 楼

从概念上讲,傅立叶变换以正弦波的频率告诉您图像中正在发生的事情。例如,如果您有一张平墙的图片,那么当您从左到右或从上到下移动时,像素的值变化很小。在频域中,这意味着您的图像包含低频,但不包含高频。

另一方面,如果您有一个栅栏图片,则像素值会改变所有从左到右的时间。因此,在傅立叶域中,X方向的频率较高,而Y方向的频率却没有。

最后,如果您有棋盘的图片,则像素值在两个方向上都会发生很大变化。因此,图像的傅立叶变换在X和Y方向上都具有较高的频率。

由于傅立叶变换可以告诉您图像中正在发生的事情,因此通常可以方便地用它们对图像中包含的频率有什么影响。例如,消除高频会使图像模糊。消除低频会给您带来优势。在保持低频的同时增强高频可以使图像清晰。

FFT被广泛用于图像处理和计算机视觉中。例如,通过使用FFT,卷积(一种基本的图像处理操作)可以更快地完成。用于图像去模糊的维纳滤波器是在傅立叶变换的有效值中定义的。但是更重要的是,即使不直接使用傅立叶变换,它也提供了一个非常有用的框架来推理图像处理操作。

史蒂夫·爱丁斯(Steve Eddins)是“使用MATLAB进行数字图像处理”的作者之一,他撰写了一系列有关傅立叶变换及其在图像处理中的用法的博客文章。