帮助手册

告警引擎

告警引擎帮助您随时了解受监控资源的可用性和性能状况。Site24x7 通过多种方式识别受监控资源行为中的异常并发出告警。告警引擎是决定告警严重程度的机制。有时,异常可能会在无需用户干预的情况下自行修复。在这种情况下,监视器不应产生误报告警,告警引擎正是为此而设计。 

状态检测

监视器定期检查资源以记录数据,当资源超过配置的阈值级别时,监视器将被声明为宕机、告警或严重状态。 
例如,对于网站监视器,当监视器检测到宕机时,根据告警设置,通知将在监视器宕机时触发——或立即触发,或在跨多个位置验证问题后触发。您也可以覆盖这些设置,仅在监视器连续宕机达到指定轮询次数后才接收告警。随后,告警引擎触发告警。监控会持续进行以识别任何状态变化,Site24x7 会将变化情况通知相关负责人。

阈值和可用性

资源状态根据其阈值和可用性配置文件中的数据设置为正常、宕机、告警或严重。两种不同类型的阈值设置为:

  • 静态阈值
  • 基于 Zia 的阈值

使用随叫随到计划属性告警组告警类别通知配置文件,自定义您希望接收的告警内容、接收时间和接收方式。

静态阈值

用户或管理员可以为告警设置阈值参数。这些阈值参数可能因监视器类型而有所不同。您可以为每个指标手动定义阈值,当超过该阈值时,将触发告警。

基于 Zia 的阈值

基于 Zia 的阈值使用机器学习模型在理解系统后设置动态阈值。机器学习会在一段时间(例如 15 天)内研究系统并训练模型。训练后的模型可以根据资源的基准性能自动设置阈值,当超过阈值时会向您发出告警。 
Zia 设置的阈值会根据不同监视器的行为模式而有所不同。每当资源功能发生变化时,Zia 会根据变化重新训练模型。当出现超出阈值的突然峰值或骤降时,基于 Zia 的异常检测会提醒您注意异常行为。通过及时通知,您可以立即采取措施防止宕机并有效利用资源。

注意

宕机结束后,系统会通过已配置的告警媒介自动向您发送根本原因分析报表,以缩短平均修复时间。 

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!