属性告警组
如何在告警中使用属性告警组?
每个组织都有多个子团队,例如基础架构团队、应用程序团队和运维团队。每个子团队都会主动监控一组 IT 资源及其相关属性,以确保运营成功。例如,基础架构团队关注服务器的正常运行时间,而应用程序团队则负责该服务器上的应用程序性能。因此,运维团队只需接收正常运行时间和可能的磁盘满告警,而其他告警则发送给应用程序团队。您可以定义特定的属性告警组,以简化告警流程,实现快速问题修复。

以下是使用属性告警组的方法。假设您是 DevOps 团队的成员,希望只接收与服务器监视器属性(如 CPU 利用率、磁盘已用空间 (%) 等)相关的告警。如何实现?首先,您需要创建一个基于属性的模板(我们称之为"DevOps 模板"),其中仅包含您要监控的相关服务器属性。假设您添加了以下服务器属性:
- 可用性
- CPU 利用率
- 磁盘已用空间 (%)
- 磁盘可用空间 (%)
- 磁盘读取
- 磁盘写入
理想情况下,您希望仅在这些服务器监视器属性的设定阈值被突破时才接收告警。创建属性模板后,将该模板与您预先配置的用户告警组"DevOps 团队"(该组又与您的服务器监视器关联)进行关联。下次您的服务器监视器发生中断时,告警引擎将首先验证 DevOps 模板中列出的属性是否触发了中断。如果验证为真,则立即向 DevOps 团队触发告警。但是,如果中断不是由上述任何属性引起的,则告警将自动被抑制。即便如此,该事件也不会丢失,因为它会以"监视器名称 + "没有配置联系人来接收以下属性的告警:" + 属性名称"的记录形式记录在告警日志中。因此,您可以创建独特的基于属性的告警模板,并将其与告警组关联,以自定义您的告警策略。

属性告警组的其他一些重要特点如下:
- 属性 "可用性" 是一个与所有监视器类型密切相关的指标。监视器的可用性属性根据监视器的状态(UP 或 DOWN)而变化。
- 属性告警组不支持插件和自定义指标监视器。
- 此功能对升级告警不会产生任何影响。但是,它将根据配置覆盖持续告警。了解更多。
- 对于带有进程的服务器监视器或具有多个网络接口的网络设备等监视器类型,无论是子属性还是父属性的阈值违规,告警都将发送给所有关联的告警联系人组。
- 各监视器类型下列出的属性可在监视器类型的阈值表单或添加表单中找到。
- 属性告警组不支持任何第三方集成。
- 某些属性可能有相同的名称后跟(监视器类型),这意味着该属性专门与该监视器类型关联。例如,交换区使用量 (EC Memcached 节点) 和交换区使用量 (RDS 实例)。
创建属性告警组
您可以按照以下步骤创建属性告警组:
- 登录 Site24x7
- 导航至 Admin > User & Alert Management > Attribute Alert Group
- 系统将提示您输入相关详情的对话框:
- Display name(显示名称):为您的属性告警组提供名称。
- Monitor type filter(监视器类型筛选):选择账户中的多个或所有监视器类型,以排序和查看所有相关性能属性。
- Resource Type Filter(资源类型筛选):选择所选监视器类型下的多个或所有资源,以排序和查看特定资源类型的性能属性。
- Choose the Resource Name(选择资源名称):选择要应用属性的资源。
Note- Resource Type Filter(资源类型筛选)和Choose the Resource Name(选择资源名称)字段目前仅支持服务器监视器。
- 具有自定义角色的用户可以使用查看我的资源选项来筛选和查看他们创建的资源。
-
- Attributes(属性):通过从可用属性池中选择一组性能属性或所有属性,创建自定义属性告警组。
- 点击 Save 按钮创建您的属性告警组。
-

- 创建属性告警组后,它将列在仪表板中。系统默认生成一个全属性告警组。
- 全属性告警组是系统生成的配置文件,包含与账户中所有监视器关联的完整性能属性列表。将全属性告警组与用户告警组关联后,该组中的所有用户将收到所有监视器中断的通知。在这种情况下,属性级别的告警验证将被忽略。
-
本页内容
- 如何在告警中使用属性告警组?
- 创建属性告警组
