我正在阅读本文:http://arxiv.org/abs/1310.2053(RGB-D基准数据集的作用:概述),并看到以下字词:


谢谢为了获得准确的深度数据,当前发表的论文可能会提出多种RGB-D设置,以解决计算机视觉中众所周知的问题,其中Microsoft Kinect的范围从SLAM
[10,12 ,19、17、35、11]进行3d重建[2、33、38、32、1]
,通过实时面部[18]和手[30]进行跟踪,以捕获运动并进行步态分析[ 34、41、8、7、4]


我认为SLAM和3D Reconstruction一词是同一回事,而本文却相反地引用了一堆引文(至今我还认为,SLAM中的Mapping与3D Reconstruction相同,而Localization是Mapping的重要组成部分。因此,我发现SLAM和3D重构之间没有区别,是我错了(还是作者作了误分类)?

#1 楼

您对SLAM和3D重建的相同性是正确的。同时,我不认为作者有误分类。

英语有点不规范。作者最好这样说:


...从SLAM到3D重建再到实时面部和手部跟踪再到...


我认为本文分别列出了两者,以更好地组织参考文献,而不是突出差异。

差异取决于您的观点。如果您考虑使用车辆导航考古站点,而不是记录有关该站点的数据以进行历史保存,则它们是不同的。传感器与实时处理与脱机处理之间的差异,以及哪种算法在每种情况下效果最佳。

可能要考虑的主要差异是,在3D重建中,传感器的路径不是传感器路径的一部分。目标,并且会随意丢弃(或不估算)。同时,在SLAM中,环境的实际几何形状和内容并不像其拓扑结构以及在其中进行本地化的能力那么重要。

您提到的算法(Kinfu,ElasticFusion等)自称为SLAM ,密集的环境地图,并且可能代表了技术的发展,在这种技术中,处理能力和可用的传感功能意味着一个无需针对一个目标(重构)或另一个目标(导航)进行优化。因此,您可以将其视为SLAM和3D重构这两个类别的融合。

评论


$ \ begingroup $
Thx〜您的观点主要是实时还是离线?我对RGB-D SLAM算法(Kinfu,Kintinuous,RGBDMapping,ElasticFusion,DynamicFusion等)特别好奇,这些算法的目的是同时用相机轨迹重建场景的密集地图。 SLAM或3D-recon,您希望将它们归为哪一类?
$ \ endgroup $
–张绍臣
16年8月8日在14:11

$ \ begingroup $
我认为类别并不重要。您只需要知道,有两组人(执行SLAM的人和进行3D重建的人)的问题域重叠很多。如果要使用机器人SLAM导航场景,或者要存储场景以进行科学,历史或电影的3D重建。
$ \ endgroup $
–hauptmech
16年8月8日在22:09



$ \ begingroup $
我根据您的评论完善了答案。
$ \ endgroup $
–hauptmech
16年8月9日在1:24

$ \ begingroup $
再次感谢您的解释;)
$ \ endgroup $
–张绍臣
16年8月9日,下午3:13

#2 楼

差异主要是出于意图。 SLAM主要用于描述在未知环境中导航时使用的映射过程。这是在线完成的,因此导航器可以使用最新的状态估算值。 3D重建通常是用于创建某些环境的3D地图的后处理过程。

或者换句话说:slam是一个迭代过程,它使用每个新的估算值创建一个更新的地图,而3D重建是一个在收集所有测量值之后运行的批处理过程。

评论


$ \ begingroup $
Thx〜通过指出批处理过程,您强调脱机过程,对吗?我对RGB-D SLAM算法(Kinfu,Kintinuous,RGBDMapping,ElasticFusion,DynamicFusion等)特别好奇,这些算法的目的是同时用相机轨迹重建场景的密集地图。 SLAM或3D-recon,您希望将它们归为哪一类?
$ \ endgroup $
–张绍臣
16年8月8日在14:13

$ \ begingroup $
我不确定您要问什么。你能改一下这个问题吗?此外,我还远不是SLAM和3D重建的专家。
$ \ endgroup $
– Holmeski
16年8月8日在15:30

$ \ begingroup $
我的意思是我认为KinectFusion等算法是SLAM以及3D重构任务。您强调的是**迭代与批处理**(我将其理解为Realtme与脱机处理),因为它的主要区别使我有些困惑...
$ \ endgroup $
–张绍臣
16年8月8日在16:49

#3 楼

SLAM基于传感器模型,有时基于姿势变化的模型,联合估算传感器的姿态和地图。该地图可以用许多不同的方式表示(例如,地标位置,占用格网,点云)。

3D重建用于基于传感器数据估算环境的3D表示。有很多不同的方法可以做到这一点。 SLAM可以是处理链的一部分,但不是必须的。