我试图找到可能的图像特征的列表,例如颜色,取向的边缘等,以测量在图像中找到相同/相似对象时的可用性。有人知道这样的列表或至少一些功能吗?

评论

这超出了主题,但是CBIR可以从Open Image数据集中提取特征吗?即使图像未保存在本地磁盘中,也可以提取图像的功能吗?

#1 楼

这个领域本身太广阔了。因此,我怀疑您是否可以在此列出完整的清单。
但是,MPEG 7是标准化该领域的主要工作之一。因此,这里包含的内容不是通用的-至少是最主要的。

以下是MPEG7中标识的一些关键功能集(我只能谈论Visual Descriptor,而其他人则不能完全看到)。

有4类视觉描述符:

1。颜色描述符,包括:
主要颜色,
颜色布局(基本上是逐块的原色)
可缩放颜色(基本上是颜色直方图),颜色结构(基本上是本地颜色直方图) ,
和色彩空间使事物可以互操作。

2。纹理描述符(另请参阅此内容),包括:
纹理浏览描述符-定义粒度/粗度,规则性和方向。
同质纹理描述符-基于Gabor滤波器组。

边缘直方图

3。包含以下内容的形状描述符:基于区域的描述符是所考虑形状的标量属性-例如面积,离心率等。
基于轮廓的捕获了实际特征形状特征和3D描述符

4。视频的运动描述符
摄像机运动(3-D摄像机运动参数)
运动轨迹(场景中对象的运动轨迹)[例如通过跟踪算法提取]
参数运动(例如运动矢量,它允许描述场景的运动。但是它可以是针对各种对象的更复杂的模型)。
活动更多是语义描述符。


MPEG 7没有定义“如何提取它们”-它仅定义了它们的含义以及如何表示/存储它们。因此,确实存在有关如何提取和使用它们的研究。

这里是另一篇很好的论文,它提供了对该主题的见解。

但是,是的,许多功能都是相当基本的,可能需要更多的研究才能创建更复杂(更复杂)的功能集。

#2 楼

好的,我认为通过搜索更多内容,我找到了合适的列表。有Deselaers等人的论文。哪个接缝正是我想要的!

#3 楼

还有一本书,捆绑了与此主题相关的一组论文。称为视觉信息检索原理。

评论


$ \ begingroup $
用Google搜寻这些书并没有得到很多正面的评价。实际上,抱怨多于积极。您是否仍然认为这是一个很好的参考,如果这样,也许您可​​以告诉我们何时对您有用? :)
$ \ endgroup $
–佩内洛普
2012年6月14日在8:52

$ \ begingroup $
放在这里的主要原因不是我经常使用它,而是我的老师推荐的(我很看重他的意见)。谷歌搜索它表明它实际上是一堆文件,而不是一本书。它也显示了它相当古老的内容,但仍是有关该主题的少数书籍之一。因此,我认为我的答案仍然合适。
$ \ endgroup $
– Geerten
2012年7月2日,9:22



#4 楼

@Dipan Mehta介绍了可以使用的功能描述符。现在让我尝试通过提及一些特征检测方法来覆盖硬币的另一面,这些方法可以提取出对CBIR有用的特征。

我在CBIR研究中所参考的是Sivic,Zisserman和Nister,Stewenius的论文。 。这些作者提供了更多的最新论文,但是这些论文提出了所有相关的想法。

他们认为,要实现有效的CBIR方法,应使用互补特性:



形状适应的区域-倾向于以拐角状特征为中心

示例:
哈里斯角,多尺度哈里斯,DoG(高斯差分) -也会对边缘做出反应!)


最大稳定区域-倾向于以斑点状特征为中心

示例:
MSER(最大稳定的外部区域,DoG



令人惊讶的是,维基百科还对特征(检测器)类型进行了很好的分类,说明了它们针对大​​多数当前广泛使用的特征检测到的感兴趣区域的类型:


边缘检测器
角检测器
气泡检测器
脊检测器


我已阅读的最新文章发誓SIFT(尺度不变特征变换)描述符会晃动并且足够坚固,可与所选特征检测器结合使用。参考文献包括:


已提供的链接

Mikolajczyk,Schmid处理本地描述符的比较


Dahl评估检测器描述符组合

注意!

最后,值得一提的是,成功的CBIR方法不仅仅取决于所使用的特征检测器和描述符,还在于还:


有效的搜索结构(视觉特征的量化)
构造图像描述符的方法-基于常见的视觉特征(局部描述符),或者通过比较全局图像描述符(这是一个非常新的想法,因此目前没有引用)。
图像描述符之间的距离度量

此外,我已经回答了一些有关DSP上的CBIR和stackoverflow的问题,它们都附带了参考资料和解释,我认为它们可能是相关的,因此您不妨看一下:


DSP:1