#1 楼
这个领域本身太广阔了。因此,我怀疑您是否可以在此列出完整的清单。但是,MPEG 7是标准化该领域的主要工作之一。因此,这里包含的内容不是通用的-至少是最主要的。
以下是MPEG7中标识的一些关键功能集(我只能谈论Visual Descriptor,而其他人则不能完全看到)。
有4类视觉描述符:
1。颜色描述符,包括:
主要颜色,
颜色布局(基本上是逐块的原色)
可缩放颜色(基本上是颜色直方图),颜色结构(基本上是本地颜色直方图) ,
和色彩空间使事物可以互操作。
2。纹理描述符(另请参阅此内容),包括:
纹理浏览描述符-定义粒度/粗度,规则性和方向。
同质纹理描述符-基于Gabor滤波器组。
和
边缘直方图
3。包含以下内容的形状描述符:基于区域的描述符是所考虑形状的标量属性-例如面积,离心率等。
基于轮廓的捕获了实际特征形状特征和3D描述符
4。视频的运动描述符
摄像机运动(3-D摄像机运动参数)
运动轨迹(场景中对象的运动轨迹)[例如通过跟踪算法提取]
参数运动(例如运动矢量,它允许描述场景的运动。但是它可以是针对各种对象的更复杂的模型)。
活动更多是语义描述符。
MPEG 7没有定义“如何提取它们”-它仅定义了它们的含义以及如何表示/存储它们。因此,确实存在有关如何提取和使用它们的研究。
这里是另一篇很好的论文,它提供了对该主题的见解。
但是,是的,许多功能都是相当基本的,可能需要更多的研究才能创建更复杂(更复杂)的功能集。
#2 楼
好的,我认为通过搜索更多内容,我找到了合适的列表。有Deselaers等人的论文。哪个接缝正是我想要的!#3 楼
还有一本书,捆绑了与此主题相关的一组论文。称为视觉信息检索原理。评论
$ \ begingroup $
用Google搜寻这些书并没有得到很多正面的评价。实际上,抱怨多于积极。您是否仍然认为这是一个很好的参考,如果这样,也许您可以告诉我们何时对您有用? :)
$ \ endgroup $
–佩内洛普
2012年6月14日在8:52
$ \ begingroup $
放在这里的主要原因不是我经常使用它,而是我的老师推荐的(我很看重他的意见)。谷歌搜索它表明它实际上是一堆文件,而不是一本书。它也显示了它相当古老的内容,但仍是有关该主题的少数书籍之一。因此,我认为我的答案仍然合适。
$ \ endgroup $
– Geerten
2012年7月2日,9:22
#4 楼
@Dipan Mehta介绍了可以使用的功能描述符。现在让我尝试通过提及一些特征检测方法来覆盖硬币的另一面,这些方法可以提取出对CBIR有用的特征。我在CBIR研究中所参考的是Sivic,Zisserman和Nister,Stewenius的论文。 。这些作者提供了更多的最新论文,但是这些论文提出了所有相关的想法。
他们认为,要实现有效的CBIR方法,应使用互补特性:
形状适应的区域-倾向于以拐角状特征为中心
示例:
哈里斯角,多尺度哈里斯,DoG(高斯差分) -也会对边缘做出反应!)
最大稳定区域-倾向于以斑点状特征为中心
示例:
MSER(最大稳定的外部区域,DoG
令人惊讶的是,维基百科还对特征(检测器)类型进行了很好的分类,说明了它们针对大多数当前广泛使用的特征检测到的感兴趣区域的类型:
边缘检测器
角检测器
气泡检测器
脊检测器
我已阅读的最新文章发誓SIFT(尺度不变特征变换)描述符会晃动并且足够坚固,可与所选特征检测器结合使用。参考文献包括:
已提供的链接
Mikolajczyk,Schmid处理本地描述符的比较
Dahl评估检测器描述符组合
注意!
最后,值得一提的是,成功的CBIR方法不仅仅取决于所使用的特征检测器和描述符,还在于还:
有效的搜索结构(视觉特征的量化)
构造图像描述符的方法-基于常见的视觉特征(局部描述符),或者通过比较全局图像描述符(这是一个非常新的想法,因此目前没有引用)。
图像描述符之间的距离度量
此外,我已经回答了一些有关DSP上的CBIR和stackoverflow的问题,它们都附带了参考资料和解释,我认为它们可能是相关的,因此您不妨看一下:
DSP:1
评论
这超出了主题,但是CBIR可以从Open Image数据集中提取特征吗?即使图像未保存在本地磁盘中,也可以提取图像的功能吗?