公司目前如何跟踪物联网设备,网关和平台上的错误?我的公司正在使用Papertrail来汇总来自所有设备的日志,但是当生产中出现错误时,这经常使我们在多个系统之间徘徊。解决可能在一个地方(例如,在IoT平台上)但由于堆栈中其他地方的问题而产生的异常的“根源”问题。来自边缘设备的数据错误。

就我在此空间中发现的数据而言,Sentry和Rollbar对于在服务器或应用程序上进行异常跟踪非常有用,但没有提供跟踪级联错误的方法如前一段所述。

是否有比文本记录更好的系统?我特别希望利用从Sentry获得的面包屑样式事件,但可以跨分布式系统进行跟踪。

#1 楼

分布式跟踪

任何有价值的分布式跟踪背后的想法在本Google白皮书中关于其Dapper解决方案的最常见的描述都是众所周知的。请注意,我并不是说他们发明了它。从本质上讲,它对于IoT的工作原理相同,只需在后端(甚至后端设备)的边缘开始跟踪。该概念可以轻松地修改为包括终端设备。 Netflix通过最近开源的Vizceral所做的每一个可视化效果都可以看出使用跟踪和跨度ID来跟踪整个系统中所有信息的魔力。区域视图下的博客内容可视化完全基于实时日志分析,其中通过跟踪ID将呼叫关联起来。请注意,就像Google在Dapper论文中提到的那样,Netflix在其API上有一些调用示例。 Google在论文中提到了1:1000,这已经有几年了。显然Netflix在某些请求类型上已经达到了1:1百万。

我不知道您的系统,但很可能您可以从实际100%跟踪开始。

无论哪种方式,只要您可以从头到物联网设备匹配跟踪,或者甚至首先在端点上创建跟踪ID,都不会阻止您以包括您的优势的方式来适应这些想法设备。

评论


谢谢Helmar,我希望在最初的问题中提到Dapper,因为我已经在阅读有关该领域的文章!当然可以利用它,但是还希望看看是否还有其他现有的解决方案正在使用中?

–钩住了
17年10月1日在17:35