我在区分对象识别和对象检测方面有些困惑。有人说物体检测是物体识别的一个子主题?有人可以澄清这两个主题之间的区别吗?

据我所知:

对象识别正在回答“图像中的对象是什么”问题鉴于对象检测正在回答“该对象在哪里”的问题?

希望有人可以通过慷慨地为每个对象提供一个示例来说明这种区别。

评论

这个答案可能会有所帮助:stackoverflow.com/a/34691321/1546088

#1 楼

您可以回答自己的问题。

对象识别:图像中描述了哪个对象?



输入:包含未知对象的图像(s)

可能在输入中标记对象的位置,或者输入可能只是对象(未遮挡)的清晰图像。


输出:图像中对象的位置和标签(名称)

对象的位置要么从输入中获取,要么根据输入图像确定。

为对象添加标签时,通常会有一组类别/标签,系统会“知道”这组类别/标签,并且系统可以区分它们(例如,对象是狗,汽车,马,牛或鸟) 。


对象检测:该对象在图像中的什么位置?


输入:对象的清晰图像或某种模型对象(例如鸭子)和包含感兴趣对象的图像(可能)的图像
output:位置或in的边界框如果图像中存在对象,则放置对象(例如鸭子在图片的左上角)


评论


$ \ begingroup $
您似乎在使用“对象检测”一词作为“对象本地化”的同义词。但是,在许多情况下(许多近期的DL论文),对象检测是指对象定位(即带有边界框)+对象分类。几乎在所有地方都非常模糊地使用了对象识别。我什至不知道为什么我们没有停止使用它。
$ \ endgroup $
–nbro
20 Jun 15'20:13



$ \ begingroup $
@nbro在最近的许多论文中,都是如此。这个答案是将近七年前写的:)
$ \ endgroup $
–佩内洛普
20年6月17日在10:18

#2 楼

迟了,但这是答案。来源:https://www.learnopencv.com/selective-search-for-object-detection-cpp-python/

对象识别算法可识别图像中存在哪些对象。它以整个图像为输入,并输出该图像中存在的对象的类别标签和类别概率。例如,类别标签可能是“狗”,而相关的类别概率可能是97%。

另一方面,对象检测算法不仅可以告诉您图像中存在哪些对象,它还会输出边界框(x,y,宽度,高度)以指示对象在图像内的位置

#3 楼

基于任何给定图像的兴趣点的物体检测;例如,在图片和识别中的鸟类谈论了有关鸟类的特定信息,例如名称,类型和特定兴趣点的其他特征。

评论


$ \ begingroup $
您是否可以扩大此答案的范围,因为目前尚不清楚如何解决该问题。至少那是我的看法。
$ \ endgroup $
– A_A
18年5月24日在10:56

$ \ begingroup $
对象识别:在任何给定的图像中,您都必须检测所有对象(一类受限的对象取决于您的数据集),使用边界框将其本地化,并用标签标记该边界框。对象识别。对象检测:类似于对象识别,但是在此任务中,您只有两类对象分类,即对象边界框和非对象边界框。例如汽车检测:您必须检测任何给定图像中的所有汽车及其边界框
$ \ endgroup $
–user35925
18年6月2日在8:40



$ \ begingroup $
对象识别正在回答“图像中的对象是什么”问题,而对象检测正在回答“该对象在哪里”问题。图像检索问题,即在大型数据库中搜索数字图像的问题。
$ \ endgroup $
–user35925
18年6月2日在8:45

$ \ begingroup $
谢谢,但我不是亲自问我。回复出现在我的审阅队列中,我认为值得将其扩展到超出您可以发表评论的范围。回答帖子通常会更加详细。祝一切顺利。
$ \ endgroup $
– A_A
18年6月2日在16:56