我是机器人技术的新手。据我所知,通常有两种获取场景深度信息的方法。一种是应用两个摄像机的立体视觉方法。另一个是RGBD传感器,例如Kinect和Primesense。似乎当前正在使用这两种方法。但是,我不知道它们彼此之间有什么优势。

我认为Kinect是解决立体视觉的完美解决方案,而忽略了其成本。所以我在这里有两个问题:


除费用之外,双目方法是否比Kinect有优势?
我知道,这两种方法都限于有限的距离检测范围。在实际应用中,有时我们还需要远距离的深度数据。有没有一种方法可以使我们在远距离上获取或估计数据信息(不考虑基于激光的探测器)。

此外,我的应用程序可能是小型飞行器。我应该选择哪种方法和设备?传统的双目相机会不会太慢?

#1 楼

实际上,kinect传感器类似于立体相机。它们由两个设备组成,一个IR发射器和一个IR接收器。发射器投射已知形状和大小的光点图案,而另一个设备接收实际的反射点。从图案的变形中可以找到深度,但是据我所知,其背后的数学与具有已知对应关系的立体三角剖分相同(请参见此视频为例)。

与立体摄影机系统相比,kinect的主要缺点是:


它不能在户外工作
它的作用范围是几米(小于8m)。

相反,立体声相机在户外工作。它们的范围取决于基线,即相机之间的距离:它越高,可以三角测量的点就越远。但是,基线为几厘米的大多数商用立体摄像机的精度为几米(例如,请参见此商用立体设备)。
您可以构建自己的立体声设备来匹配所需的精度,但是如果要获得良好的精度,与kinect相比,该设备将并不便宜(主要取决于您认为要购买的相机),并且价格昂贵您需要时间进行设置。
最后,如果必须对很远的点进行三角测量,则可能需要使用“运动中的结构”算法(有关快速定义,请参阅Wikipedia)。

评论


$ \ begingroup $
好吧,第一版Kinect使用结构化光照方法,但是第二版使用飞行时间方法。我认为Kinect的第二版实际上不同于立体相机。
$ \ endgroup $
–user49550
2015年3月8日,12:47

#2 楼

我知道您说过“不考虑基于激光的探测器”,但是我假设您因价格而打折吗? Sparkfun有一个价格不到100美元的激光雷达装置,据称射程可达40m。这大约是Kinect传感器价格的一半。 AFAIK,此单元只能测量范围到单个点,我不确定将其实现为光栅扫描仪有多么容易。

评论


$ \ begingroup $
它只能测量到单个点的范围。我认为扩展到栅格化将非常困难
$ \ endgroup $
–user49550
2015年3月15日在7:30



$ \ begingroup $
@ user49550,我认为这不会“极其困难”。最初的光栅设备CRT是用光子枪制造的,该光子枪将光束投射到一个点上。
$ \ endgroup $
–章鱼
2015年8月4日在20:10



#3 楼

对于收集深度信息以及通常用于地图绘制,还没有完美的解决方案。选择传感器之前,您需要对应用程序有个很好的了解。尝试缩小选择范围。您要在室内还是室外使用它?您想要深度测量的速度有多快(您可以使用单个摄像头,但是大约需要10秒钟才能生成良好的点云)?范围是多少?您希望它的精确度如何(激光雷达)?您需要什么分辨率(例如320x240)?您的处理能力是什么?体重限制?您是否要振动(届时没有激光雷达)?

立体视觉传感器的配置直接影响范围和精度。您可以增加两个摄像机之间的距离,以获得更大距离的更可靠的测量。制作自己的立体视觉传感器并不难。唯一棘手的部分是两个级别的校准。一种是用于平整每个摄像机的记录图像,另一种是计算两个摄像机之间的几何平移关系。您还可以在系统中添加更多摄像机。例如,有一个PointGrey传感器使用3个摄像头,并且使用的立体视觉原理相同。

飞行时间摄像头通常更小,更轻。处理速度更快,并提供更多信息(例如颜色)。对于室外或需要远距离的应用,它们不是很好的选择。发出的光可能会反射一次以上(不会像声纳传感器那样经常发生)并且测量结果不准确。

说到声纳,您可能要看一下侧扫声纳。

评论


$ \ begingroup $
每次使用时都需要校准双筒照相机吗?即使我固定了它们(即固定了它们的相对位置和所有其他内部参数并将系统作为一个整体)并将整个系统带到不同的地方?
$ \ endgroup $
–user49550
15 Mar 9 '15 at 0:47



$ \ begingroup $
如果它们是固定的,一次就足够了。如果更改相对位置,则仅需要校准几何参数。
$ \ endgroup $
– BarzinM
2015年3月9日,凌晨3:04

#4 楼

我不熟悉Kinect的内部原理,但是这些RGBD设备本质上不是在内部使用立体视觉吗?

不管怎样,立体视觉需要一些软件来为您提供RGBD值(很可能已经有库免费提供),但这些设备已经为该特定技术编写了该软件。最后,您获得的数据是相似的。

关于第二个问题,摄像机之间的距离越远,您看到的3D越多。因此,如果您使用两个摄像头,则优点是您可以始终根据目标的距离调整它们的距离。 Xtion,Kinect和类似技术针对特定情况进行了优化(可以识别几米远的电视前方的人),因此,仅当您的条件类似时,它们才适合。