网络设备的阈值和可用性
添加网络监视器并跟踪关键网络设备的所有性能指标,帮助网络团队可视化、监控、优化和管理网络设备和接口。
阈值和可用性配置文件帮助告警引擎决定特定网络设备或资源是否应被判定为宕机或故障状态。阈值也可以为子属性配置,例如网络接口和性能计数器。
添加阈值和可用性配置文件
当应用于以下任何阈值策略的条件被满足时,监视器状态将变为故障或严重。
- 点击管理 > 配置文件 > 阈值和可用性。
- 在阈值和可用性界面中点击添加阈值配置文件,在下拉列表中选择阈值配置文件。
- 指定以下详细信息,为网络设备添加阈值和可用性配置:
- 监视器类型:从下拉列表中选择网络设备。
- 显示名称:提供用于标识的名称。
- 当设备未响应 SNMP 查询时告警:切换为是,以便在设备未响应 SNMP 查询时收到告警。
- 当接口宕机/故障时告警:切换为是,以便在设备中的任意接口宕机或处于故障状态时收到告警。
- 当交换机堆叠中的单个交换机宕机时告警:切换为是,以便在交换机堆叠中的单个交换机宕机时收到告警。
- 当温度传感器状态宕机时告警:切换为是,以便在温度传感器状态为宕机时收到告警。
- 当温度传感器发生故障时告警:切换为是,以便在温度传感器故障时收到告警。
- 当风扇传感器状态宕机时告警:切换为是,以便在风扇传感器状态为宕机时收到告警。
- 当风扇传感器发生故障时告警:切换为是,以便在风扇传感器故障时收到告警。
- 当电源传感器状态宕机时告警:切换为是,以便在电源传感器状态为宕机时收到告警。
- 当电源传感器发生故障时告警:切换为是,以便在电源传感器故障时收到告警。
- 当电压传感器状态宕机时告警:切换为是,以便在电压传感器状态为宕机时收到告警。
- 当电压传感器发生故障时告警:切换为是,以便在电压传感器故障时收到告警。
- 当对等方宕机时告警:切换为是,以便在对等方宕机时收到告警。
- 当 Trap 处理因设备限制而暂停时告警:切换为是,以便在 Trap 处理因设备限制而暂停时收到告警。
- 阈值类型:选择静态阈值以手动设置阈值,或选择基于 Zia 的阈值以使用异常检测跟踪异常峰值并设置动态阈值。从下拉菜单中选择需要配置阈值的指标,在阈值字段中输入对应单位的值,在条件字段中设置阈值条件(<、<=、=、>、>= 或 !=),选择适当的轮询策略,并在每个指标旁边输入轮询值和监视器状态(严重或故障)。当这些阈值条件被违反时,您将收到告警。
- 设备级属性:响应时间、丢包率、CPU 利用率、内存利用率和系统正常运行时间。
- 接口级属性: 入流量、出流量、总流量、接收利用率 (%)、发送利用率 (%)、错误率 (%)、丢弃率 (%)、接收流量、发送流量、总流量、接收单播包、发送单播包、接收广播包、发送广播包、接收组播包、发送组播包、接收非单播包和发送非单播包
- 硬件传感器值:温度传感器值和电压传感器值
- BGP 对等指标:总翻转次数、入站更新、出站更新、已发送消息和已接收消息
- OSPF 指标:总翻转次数
- 隧道:入流量和出流量
- 附加设置:对于每种阈值配置,您还可以选择自动化步骤和事件原因模板。
说明您可以选择配置片段(Configlet)作为自动化步骤。但是,只有当网络设备也被添加为 NCM 监视器时,该步骤才会被执行。
- 高级阈值:使用逻辑运算符跨多个属性设置复杂的告警条件,通过高级阈值设置精确检测异常。您可以在条件部分通过下拉菜单提供选项,或在自定义函数部分通过脚本提供自定义逻辑。
- 点击保存。
工作原理
轮询计数是验证阈值违规的默认策略。您可以通过对指定阈值策略应用多个条件(>、<、=、>=、<= 或 !=)来验证阈值违规。当应用于以下任何阈值策略的条件被满足时,监视器状态将变为故障或严重:
- 轮询计数:当应用于阈值的条件在指定轮询次数内持续被验证时,监视器状态将变为故障或严重。
- 轮询平均值:当配置的轮询次数内属性值的平均值持续超出应用于阈值的条件时,监视器状态将变为故障或严重。
- 持续时间(分钟):在配置的持续时间内,所有轮询均持续满足应用于阈值的指定条件时,监视器状态将变为故障或严重。
- 平均时间(分钟):当配置的平均时间内属性值的平均值持续满足应用于阈值的条件时,监视器状态将变为故障或严重。
轮询平均值步骤中提到的多轮询检查策略默认不会应用。在无法应用任何策略的条件下,阈值违规将仅针对单次轮询进行验证。
说明
为确保持续时间(分钟)策略或平均时间(分钟)策略中应用的阈值违规检测条件按预期工作,您必须确保指定的持续时间至少是该监视器检查频率的两倍。
信息
阈值配置文件也可以为单个接口配置。了解更多关于为网络接口和性能计数器配置阈值的信息。
编辑网络设备的阈值和可用性配置文件
- 点击您想要编辑的配置文件。或者,您可以导航至网络 > 网络设备 > 点击某个设备,点击汉堡图标
,然后点击编辑。接下来,点击配置文件部分中阈值和可用性字段旁边的铅笔图标
。 - 在编辑阈值和可用性窗口中编辑需要更改的参数。
- 点击保存。
删除网络设备的阈值和可用性配置文件
- 在阈值和可用性界面中点击需要删除的配置文件。
- 这将跳转至编辑阈值和可用性窗口。
- 点击删除。
