告警引擎
告警引擎帮助您随时了解受监控资源的可用性和性能状况。Site24x7 通过多种方式识别受监控资源行为中的异常并发出告警。告警引擎是决定告警严重程度的机制。有时,异常可能会在无需用户干预的情况下自行修复。在这种情况下,监视器不应产生误报告警,告警引擎正是为此而设计。
状态检测
监视器定期检查资源以记录数据,当资源超过配置的阈值级别时,监视器将被声明为宕机、告警或严重状态。
例如,对于网站监视器,当监视器检测到宕机时,根据告警设置,通知将在监视器宕机时触发——或立即触发,或在跨多个位置验证问题后触发。您也可以覆盖这些设置,仅在监视器连续宕机达到指定轮询次数后才接收告警。随后,告警引擎触发告警。监控会持续进行以识别任何状态变化,Site24x7 会将变化情况通知相关负责人。
阈值和可用性
资源状态根据其阈值和可用性配置文件中的数据设置为正常、宕机、告警或严重。两种不同类型的阈值设置为:
- 静态阈值
- 基于 Zia 的阈值
使用随叫随到计划、属性告警组、告警类别和通知配置文件,自定义您希望接收的告警内容、接收时间和接收方式。
静态阈值
用户或管理员可以为告警设置阈值参数。这些阈值参数可能因监视器类型而有所不同。您可以为每个指标手动定义阈值,当超过该阈值时,将触发告警。
基于 Zia 的阈值
基于 Zia 的阈值使用机器学习模型在理解系统后设置动态阈值。机器学习会在一段时间(例如 15 天)内研究系统并训练模型。训练后的模型可以根据资源的基准性能自动设置阈值,当超过阈值时会向您发出告警。
Zia 设置的阈值会根据不同监视器的行为模式而有所不同。每当资源功能发生变化时,Zia 会根据变化重新训练模型。当出现超出阈值的突然峰值或骤降时,基于 Zia 的异常检测会提醒您注意异常行为。通过及时通知,您可以立即采取措施防止宕机并有效利用资源。
图 1:告警引擎的作用。-
本页内容
- 状态检测
- 阈值和可用性
- 静态阈值
- 基于 Zia 的阈值
