我将在此处使用比例不变特征变换算法作为示例。 SIFT基于图像的比例高斯滤波创建比例空间,然后计算高斯差以检测潜在兴趣点。这些点被定义为跨越高斯差异的局部最小值和最大值。

据称这种方法是尺度不变的(在其他令人困惑的不变中)。为什么是这样?我不清楚为什么会这样。

评论

不知道什么是SIFT,请在wiki en.wikipedia.org/wiki/Scale-invariant_feature_transform上找到它。 “ Lowe的图像特征生成方法将图像转换为大量的特征向量,每个特征向量对于图像平移,缩放和旋转都是不变的,对于照明变化部分不变,并且对局部几何变形具有鲁棒性。”是解释吗?

是的,这就是我在说的

SIFT使用比例空间理论。但是,我不理解该理论中“尺度”不变性的含义。您可以尝试阅读托尼·林德伯格(Tony Lindeberg)的相关论文:csc.kth.se/~tony/earlyvision.html

#1 楼

术语“尺度不变”在这里表示以下含义。
假设您有图像I,并且已经在某个位置(x,y)和某个尺度级别s上检测到特征(aka兴趣点)f 。现在,假设您有一张图像I',它是I的缩放版本(例如,降采样)。然后,如果特征检测器是尺度不变的,那么您应该能够在相应位置(x',y')和相应尺度s'(其中,(x,y,s))处的I'中检测到相应的特征f'。和(x',y',s')通过适当的缩放转换相关。

换句话说,如果您的尺度不变检测器已检测到与某人的脸部相对应的特征点,然后在同一场景中使用相机放大或缩小,则仍应检测到该特征点

当然,您还需要一个“特征描述符”,该特征描述符可让您匹配两个特征,而这正是SIFT所提供的。

因此,冒着使您进一步困惑的风险,这里有两件事是规模不变的。一个是DoG兴趣点检测器,它是尺度不变的,因为它可以检测特定类型的图像特征(斑点),而与它们的尺度无关。换句话说,DoG检测器可检测任何大小的斑点。尺度不变的另一件事是特征描述符,它是梯度方向的直方图,尽管尺度发生了变化,但对于相同的图像特征还是差不多。

高斯滤波器在这里用作高斯滤波器的拉普拉斯算子的近似值。

评论


$ \ begingroup $
您已经从比例空间理论中获得了一些信息。您能用标度空间理论描述两个信号的比较中到底发生了什么吗? Lindeberg在他的论文中:csc.kth.se/~tony/earlyvision.html给出了检测斑点等的一些示例。缩放参数实际取导数实际上如何有助于缩放不变性?
$ \ endgroup $
–最大
2011年11月1日,下午3:11

$ \ begingroup $
你是正确的。我只是试图描述尺度空间理论背后的直觉。您要问的是一个单独的问题。 :)我认为您在说的是必须对不同比例下的导数进行适当的归一化。当您使用较粗的标度时,信号会变得平滑,因此振幅会降低。这意味着导数的大小也减小了。因此,要比较跨比例的微分响应,您需要将它们乘以
$ \ endgroup $
–迪马
2011年11月1日14:12

$ \ begingroup $
sigma的适当幂:一阶是sigma,二阶是sigma ^ 2,依此类推。
$ \ endgroup $
–迪马
2011年11月1日14:19

$ \ begingroup $
@maximus,哎呀,我忘了@。 :)
$ \ endgroup $
–迪马
2011年11月1日14:37

$ \ begingroup $
感谢您的答复!它对我有帮助,但是在这里还有一些问题是我提出的另一个问题:dsp.stackexchange.com/questions/570/…
$ \ endgroup $
–最大
2011年11月1日18:48



#2 楼

高斯的差异不是尺度不变的。 SIFT(在有限程度上)是尺度不变的,因为它在整个尺度空间中寻找DoG极值-即在空间上和相对于相邻尺度的范围内都找到DoG极值的尺度。因为针对此固定比例(而不是输入比例的函数)获得了输出DoG,所以结果与比例无关,即比例不变。

评论


$ \ begingroup $
对。但是,它仅在相邻尺度上寻找极值。除非我弄错了,这还不是全部的尺度。即使是所有的比例尺,仍然不清楚如何独立于比例尺
$ \ endgroup $
–水
2011年10月11日12:16

$ \ begingroup $
@water,完全正确。您不希望所有尺度的极值,而是局部极值。这使您可以检测嵌套结构,例如在灰色背景的大明亮圆圈内的一个小黑眼圈。
$ \ endgroup $
–迪马
2011-10-12 14:29

$ \ begingroup $
使用DoG代替LoG,因为它可以更快地计算DoG。
$ \ endgroup $
–最大
2011年11月1日,下午3:06