森林图像中的检测痕迹

有没有人知道任何研究/论文/软件来识别森林场景图像中的踪迹（从直线或点对点曲线）（从沿着踪迹某处的相机的角度来看）？
我正在尝试找到一种算法，该算法可以拍摄如下图像：

并生成一个掩码，以标识可能的“痕迹”，例如：

如您所见，原始图像有点模糊，这是有目的的。图像源不能保证完美的聚焦，因此我需要能够处理合理数量的噪点和模糊。寻找明显的色差（指示轨迹“边缘”）。但是，我很快意识到阴影和照明的其他变化很容易使它消失。
我正在考虑提取SURF特征，但是只有当图像完全清晰且照明一致时，SURF / SIFT才能成功。
我还尝试将图像和蒙版缩小到更小的尺寸（例如100x75），将它们转换为1xN向量，并使用它们来训练基于FANN的神经网络（图像是输入和掩码是所需的输出）。即使是这么小的尺寸，只有1个隐藏层（占输入矢量的75％），训练仍然花费了6个小时，而且仍然无法预测测试集中的任何遮罩。
有人可以建议其他吗方法或有关该主题的论文？

您没有提及任何内容，但是您控制相机/图像采集吗？人们在类似情况下使用近红外图像来使用植被指数（考虑从卫星计算森林覆盖率）。如果您有近红外线，则可以直接解决该问题。

我有，有点。我正在使用便宜的单筒相机（网络摄像头/手机相机）拍摄图像，但是我不认为它们会存储红外线。

使用可以区分植被和污垢光谱的多个滤色镜可能会有所帮助

我很好奇您是否尝试过贝叶斯方法进行训练和检测。我有几天前写的答案，但后来删除了它，因为我认为您在尝试后已将其关闭。如果您尚未考虑该选项，我很乐意取消删除它。

@yoda，贝叶斯方法是什么意思？我只熟悉贝叶斯应用于离散分类和逻辑网络。我对将其应用于CV并不熟悉。我不记得您看到过任何帖子。

#1 楼

它本身可能还不够，但是由于问题之一与照明变化有关，因此阴影去除预处理步骤可能会有所帮助。我正在考虑的技术在以下论文中进行了描述：

“关于去除图像中的阴影”，GD Finlayson，SD
Hordley，C. Lu，和MS Drew，IEEE模式分析和机器智能（PAMI），第28卷，第1期，2006年1月，第59-68页。
http：//www.cs.sfu。 ca /〜mark / ftp / Pami06 / pami06.pdf

该过程的第一部分生成照度不变的灰度图像，在这种情况下可能正是您想要的。这是他们在论文中给出的示例的快照：图像可能是您需要清晰地区分生叶和枯叶的图像。再次举例说明：

（来源：datageist.com）

然而，要注意的是，相机需要首先进行校准。假设有可能，它们描述的表示形式的某种组合可能会使您使用的其他方法更有效。

#2 楼

我认为您在源图像中没有足够的信息来生成蒙版图像。您可能会先按颜色进行细分，即绿色不落后，灰色/棕色则不行。但是，蒙版中未显示“足迹边界”上的灰色/棕色区域。（请参见源图像的左下象限。）

您提供的遮罩暗含了源图像中不明显的结构约束：例如，也许您的迹线具有固定宽度-那么您可以使用信息以约束模式识别器返回的初步蒙版。路径是否具有某些土壤/砾石特征？作为人类（相当擅长模式识别！），我受到左下象限中显示的功能的挑战：我看到灰色/棕色区域无法作为“足迹”打折。如果我掌握了更多信息，也许可以结论性地做到这一点：一张地图和一个大概已知的位置，在这条路上的个人经历，或者是导致这一点的一系列图像-如果识别器“知道是什么导致了这一幕。

我认为，图像集合是最有趣的方法。继续这种思路：一幅图像可能无法提供足够的数据，但是全景图像可能会模糊场景。

$ \ begingroup $
是的，足迹与其他人合并。是的，足迹由土壤/砾石特征来描绘，因为这些特征应与非足迹区域不同。我同意，该图像在某些部分可能具有挑战性，但我仍然认为有足够的信息可以很好地猜测路径在哪里。即使您不熟悉这条路线，听起来也没有问题（除了左下角的区域，这是可以理解的）。
$ \ endgroup $
–塞林
2011-10-14 14:27

$ \ begingroup $
的确，我可以很好地猜出这条路的边界。但是，恐怕我所依赖的信息多于源图像中提供的信息。我“知道”一条路径是什么-大概是因为我已经构建了包含一条路径的显着特征的模型或模板：通过直接体验，或者在图片中看到定义明确的路径等。在源图像中，我所画的比在源图像中所观察到的要多得多。
$ \ endgroup $
–Throwback1986
2011-10-14 15:56

$ \ begingroup $
视觉系统可能会利用该路径的一些特征：大概我们可以假设该路径代表自由的，可导航的空间。因此，树木，灌木丛和岩石特征可以归类为“非足迹”。也许纹理分析可以帮助辨别这些？不过，我不确定：树下的地面（从左上到中）看起来与小径非常相似。
$ \ endgroup $
–Throwback1986
2011年10月14日下午16:01

$ \ begingroup $
我的第一个想法是引用LU或Eigen变换，当纹理非常粗糙时，它们会产生很高的响应。但是，这里的足迹与非足迹之间的主要区别似乎是颜色。因此，也许将其转换为HSV颜色空间，并从具有“土”色（棕褐色或o石色）的像素制作一个遮罩，即可得出大致的估算值。
$ \ endgroup $
– AruniRC
2011年10月21日上午10:30

#3 楼

没有任何一种算法可以神奇地检测随机图像中的踪迹。您将需要实现一个基于机器学习的例程，并对其进行“训练”以检测踪迹。无需赘述太多，这是您在监督学习方法中将要进行的工作的粗略概述。在不同环境中的小径图片，您（主管）在其中标记了什么算作“小径”，什么是背景“森林”。您可以将图像分成较小的部分（通常为8x8），然后通过对块进行DCT（离散余弦变换）将其转换为“特征空间”。在这种情况下，每个块的DCT给您一个64点的“特征向量”。

定义特征空间$ \ mathcal {X} $，特征集$ \ mathbf {x} $（a您的64点特征向量的子集），以及具有类$ y_1 = trail $和$ y_2 = forest $的类空间$ \ mathcal {Y} $，可以从您的训练集中进行计算： br />类条件分布

$ \ mathcal {P} _ \ mathcal {X | Y}（\ mathbf {x} | trail）$$，要素的条件密度当类为$ trail $时。
$ \ mathcal {P} _ \ mathcal {X | Y}（\ mathbf {x} | forest）$，当类为$ forest $时要素的条件密度。

类别概率或先验概率

$ \ mathcal {P} _ \ mathcal {Y}（trail）$，发现概率区块中的$ trail $
$ \ mathcal {P} _ \ mathcal {Y}（forest）$，在区块中找到$ forest $的概率

通过此操作，您可以测试图像（再次将其分解为较小的部分）并计算后验概率。使用贝叶斯决策理论，您可以定义二进制（在这种情况下）选择标准，例如

$$ \ widetilde {y} _i（\ mathbf {x}）= \ arg \ max_ { y_i} \ quad \ mathcal {P} _ \ mathcal {X | Y}（\ mathbf {x} | y_i）\ \ mathcal {P} _ \ mathcal {Y}（y_i）$$
您将每个块分配给具有最高后验概率的类别。这将导致您的二进制掩码。

请注意，这是该方法的非常简化的概述。需要考虑几件事，其中最重要的是为您的问题选择正确的功能集。您还可以做一些更复杂的事情，例如使用混合模型和基于核的密度估计，但是所有这些都太详细了，很耗时，无法编写答案。

为了激励和确认这种方法值得尝试，下面举一个我很久以前作为家庭作业所做的事的示例，它与您要实现的目标非常相似。目的是从背景植被中检测出动物（左图）。右图显示了在“学习”后获得的用于区分前景和背景的二进制掩码。

想看几本教科书。该领域中一本知名且经常推荐的教科书是：

T. Hastie，R。Tibshirani和J. Friedman，《统计学习的要素：数据挖掘，推理和预测。 Springer-Verlag（2008年）第2版，

，现在可以通过提供的链接免费获得PDF。另一本不错的书是：

R. O. Duda，P。E. Hart和D. G. Stork，《模式分类》，第二版，John Wiley＆Sons（2001）

$ \ begingroup $
关于这一点，我想指出ml-class.org，它是机器学习的绝佳入门。
$ \ endgroup $
–bjoernz
11-10-26在11:10

$ \ begingroup $
有趣的方法。但是，当您说Py（足迹）和Py（森林）是“在整个图片中找到一条迹线的可能性”时，您是说在8x8的块中还是在整个图像中找到它们的可能性？如果整个图像，我都想这两个都是100％，因为所有训练图像都会在某个地方有这两个图像。
$ \ endgroup $
–塞林
2011-10-26 13:46

$ \ begingroup $
@Cerin：对不起，Py（trail），我的意思是在一个街区找到它的可能性。因此，这就是在整个图片中具有尾随的所有块的总数。我已经对其进行了更正
$ \ endgroup $
–乳香
2011-10-26 14:15

$ \ begingroup $
如何定义特征空间X？您是否会使用类似K-Means聚类的方法将64点特征向量的维数减少到10个特征？
$ \ endgroup $
–塞林
2011-10-27 21:45

$ \ begingroup $
@Cerin是的，K-means是降低维数的常见方法之一。
$ \ endgroup $
–乳香
2011年10月30日在6:24

#4 楼

这有什么用吗？

通过颜色空间融合和时间分析的实时可遍历表面检测

$ \ begingroup $
是的，这似乎与我的域名非常相似。谢谢。
$ \ endgroup $
–塞林
2011年10月17日15:56

#5 楼

看起来像是纹理分割（不是颜色分割）的问题
有很多方法，

它们经常使用Gabor小波，就像这样
http：// note .sonots.com / SciSoftware / GaborTextureSegmentation.html

基于超像素的细分
http://ttic.uchicago.edu/~xren/research/superpixel/

和类似的图形切割分割
http://en.wikipedia.org/wiki/Graph_cuts_in_computer_vision

这是Wiki概述
http://en.wikipedia.org/wiki/ Segmentation_（image_processing）

$ \ begingroup $
gabor纹理分割看起来不错！
$ \ endgroup $
– nkint
2012年6月19日，9：53

编程黑洞网