我从事一个项目已经有一段时间了,以检测和跟踪从无人机捕获的视频中的车辆,目前,我正在使用SVM,该SVM受过从车辆和背景图像中提取的局部特征的特征包表示训练。然后,我正在使用滑动窗口检测方法来尝试在图像中定位车辆,然后我想对其进行跟踪。问题在于这种方法远远不够缓慢,而且我的检测器不够可靠,因此我得到了很多误报。

所以我一直在考虑将汽车从查找近似位置的背景,以便在应用我的分类器之前减少搜索空间,但是我不确定该怎么做,希望有人可以提供帮助?关于使用层进行运动分割,使用光流按流模型分割帧的方法,是否有人有使用此方法的经验,如果可以,您是否可以提供一些输入,例如您是否认为此方法适用于我的问题。 >
UPDATE:我也将这个问题发布到了堆栈溢出上,并且得到了一个很好的答案,我已经实现了这个想法,它的工作效果令人惊讶,现在我正在研究除这种技术外还使用光流技术。 br />
下面是示例视频的两个帧

f rame 0:


第5帧:


#1 楼

optical,光流也是一个困难的问题;-)

好,为了更具建设性,这里有一些算法值得一试(或已在此特定序列上尝试过): />

在车辆数据库上重新训练您的功能包,使其在实际问题上更具代表性(尺寸和方向),以获得更好的结果
利用地面这一事实是一个平面,用于执行某些参数光学流(搜索仿射流)或计算序列的帧之间的仿射配准。然后,移动的车辆将与该主导运动相异。
使用某种光流算法来计算流量,然后尝试对光流向量进行分类/聚类(这仍然是一个普遍存在的问题!)。根据您使用的语言,您可以使用OpenCV的光流,一种来自TU Graz,D。Sun的光流,甚至是我的;-)。但是请注意,对流进行分割将是一项不平凡的任务,您可能应该分两个步骤进行:全局(主要)运动仿真,然后进行小运动检测。