在比例空间理论中,信号$ f(x)的比例空间表示形式为x =(x_1,...,x_d)$(在图像$ d = 2 $的情况下)为:
$ L(x,y; t)= g(x,y; t)* f(x,y)$其中$ g(x,y; t)$是具有参数$ t $和$的高斯核* $是一个卷积。通过更改$ t $参数,我们将获得或多或少的平滑图像。结果,较粗略的表示(参数$ t $)将不会包含小物体或噪音。

重点是找到尺度不变特征检测的方法,对吗?因此,对于某些尺寸减小的图像,即使尺寸不同,也可以正确检测到像关键点之类的功能,而不会找到其他噪点。


在本文中,他们使用的是$ \ gamma $标准化的导数。
$ \ delta _ {\ xi,\ gamma-norm} = t ^ {\ gamma / 2} \ delta_x $。
使用$ \ gamma $归一化的导数是什么意思,它对尺度不变性有什么帮助?在尺寸方面)。怎么可能呢?



如果您可以逐步解释尺度不变特征检测算法,那就太好了。实际完成了什么?导数可以用$ x,y $或$ t $取。可以通过将$ L $的导数乘以$(x,y)$变量来检测Blob。 $ t $的导数在这里有什么帮助?

我正在阅读的论文是:具有自动刻度选择功能的特征检测

#1 楼


自从我阅读Lindeberg的论文以来,确实已经有很长时间了,所以
这个符号看起来有些奇怪。结果,我的最初答案是错误的。
$ \ gamma $不是比例级别。它似乎是可以调整的某种参数。的确,您需要将导数乘以$ t $的适当乘方。 $ t $本身对应于一个比例级别,其能力取决于导数的顺序。
您可以在同一位置找到多个比例的关键点。那是因为您寻找尺度上的局部最大值。这是直觉:想想一张脸的图像。在精细的尺度上,您会得到与鼻子相对应的斑点。在课程规模上,您将获得与整个脸部相对应的斑点。这两个斑点位于同一点的中心,但是比例不同。

以下是整个算法:


确定您感兴趣的图像特征(例如,斑点,拐角,边缘)
根据导数定义相应的“检测器功能”,例如G。
计算检测器功能在一定范围内所需的导数。
将导数响应乘以$ t ^ {m \ gamma / 2} $,其中$ m $为
计算整个标度空间上的检测器函数。
在$ x,y,t $上找到检测器函数的局部最大值。
这些是您的兴趣点或关键点。

Lindeberg在论文中证明$ t ^ {\ γ/ 2} $是导数归一化的适当因子。我认为我无法在此处复制证明。
您不接受关于$ t $的导数。您只计算关于$ x $和$ y $的导数,但是要在一定范围内计算它们。考虑这种情况的一种方法是,通过使用具有一定方差$ t $的高斯滤波器反复模糊图像,首先生成高斯比例空间。然后在每个比例级别上针对$ x $和$ y $计算导数。
您希望在比例上找到局部最大值,因为在同一位置可能具有不同大小的图像特征。想一想同心圆的图像,就像一个靶心。它会在几个方面为您提供拉普拉斯算子的高响应。或想像一下拉普拉斯人在一系列比例尺下过滤掉的真实人眼图像。对于瞳孔,您将在小比例尺上获得高响应,对于虹膜将在中等比例上获得高响应,而对整个眼睛而言,则将获得粗略响应。您不知道感兴趣的功能可能会提前到什么规模。因此,您可以查看所有刻度。

评论


$ \ begingroup $
1.我们如何提供$ t ^ {\ gamma / 2} $足以使派生响应实际归一化的乘数? 2.我认为$ t $的导数用于在达到最大值的位置找到参数$ t $。为了找到最佳规模。因此,正如您所写的,似乎我必须在整个选定范围内以$ t $计算导数。结果,我将发现(通过用$ x,y $取导数)不同比例的特征。对?
$ \ endgroup $
–最大
11年2月2日在1:08

$ \ begingroup $
正如您在第3篇文章中所写:在$ x,y,t $上找到检测器函数的局部最大值为什么我们需要在t处找到局部最大值?您能否详细说明该步骤?实际上,这里如何使用$ t $的导数?
$ \ endgroup $
–最大
2011年11月2日,下午1:09

$ \ begingroup $
@maximus请参阅答案的编辑。
$ \ endgroup $
–迪马
2011年11月2日14:05

$ \ begingroup $
@maximus,我之前弄错了。伽马不是刻度级别。我已经解决了答案。
$ \ endgroup $
–迪马
11年2月2日在17:54