当前,我们使用Jenkins运行小型的node.js脚本,以检查应用程序是否正在执行应有的功能。就像,我们有一些例程应在一定间隔内运行,我们需要检查这些例程是否已运行并且已完成了我们期望的一切。

为什么詹金斯?主要是因为我们可以登录并查看仪表板,并一目了然地查看我们所有作业的健康状况;我们可以设置通知;并且因为我们不知道其他工具以“监视”方式执行脚本。

但是我们知道我们滥用Jenkins和我们面临的问题(例如遭受的攻击,我们的詹金斯(Jenkins)实例攻击一家信用卡公司,而且持续不断的不稳定性)使我们正在寻找另一种工具(或多种工具)。

但是我能找到的只是性能监控工具。你们用什么工具来监控性能以外的东西?

评论

对于定期运行,基于硒的每小时可用性测试,我们这里有两个工具,Axway Automator和Rundeck。您可能对软件建议有更多反馈。

这种攻击是如何发生的?如果您提供更多详细信息,了解您如何滥用詹金斯可能会更有帮助。

#1 楼

我们使用Datadog,并使用statsd协议(http://docs.datadoghq.com/guides/metrics/)从重要的操作流程中推入度量标准,因此在应用程序方面,我们与Datadog的联系不是太深。 >
然后在Datadog的界面中,我们可以配置监视器以对任何数量的事件发出警报,包括如果无法定义阈值,则可以进行异常检测。

因此,例如,我们有许多任务可以在他们将每小时将数据点发布到给定的指标(app.task.task_name),然后我们将监视该指标在每小时一个数据点上是否始终发布。如果费率发生变化,我们会收到警报。

#2 楼

我使用Sparky监视内部应用程序状态。 VSTS建立成功,ssl证书,源代码一致性等。它非常适合,因为我有一个仪表板,可为我提供有关跨不同项目和应用程序的系统最关键部分的基本信息。

#3 楼

您在哪里拥有基础架构?我发现在大多数简单情况下,AWS Cloudwatch都非常不错。 Zabbix也是一个很好的开源工具。当然有Solarwinds NPM,但这非常昂贵。

#4 楼

我可能建议您调查一下Prometheus:

https://prometheus.io/docs/instrumenting/clientlibs/

您可以从应用中提取指标并对其发出警报,添加grafana仪表板等。

评论


问题是关于监视性能以外的其他问题,也许您可​​以扩展一下普罗米修斯如何帮助运行和监视批处理过程?

–滕西拜
17年6月23日在7:28

#5 楼

我目前正在使用与AWS和CloudWatch集成的TotalCloud。它用于在单个窗格中进行基础结构监视和管理。