如何监控华为云 DMS RabbitMQ
Site24x7 持续监控您的 DMS RabbitMQ 指标,为您的团队提供对连接和通道健康状况、消息队列深度以及消息生产和投递速率的实时可见性。
提前发现消费者滞后、Broker 流量控制和队列瓶颈,确保消息基础设施稳定运行。
使用场景
防止消费者滞后:未确认消息数上升而消费速率下降,表明消费者处理速度跟不上。对未确认消息数设置告警,在积压导致延迟或内存压力之前及时扩容消费者。
流量控制检测:Flow 和阻塞连接数表明 Broker 因资源压力(如内存或磁盘使用率过高)正在对发布者进行流量限制。实时监控这些状态,在生产者丢弃消息或超时之前进行干预。
队列诊断:对比运行中与流控中的队列数以及运行中与阻塞通道数,判断瓶颈是源于消费者处理过慢、消息体积过大,还是 Broker 资源不足。
设置与配置
在华为云集成过程中,DMS RabbitMQ 资源将被自动发现并监控。如需启用监控,请按照以下步骤操作:
- 前往 Cloud > Huawei > Add Huawei Monitor,了解如何添加华为云监视器。
- 在添加或编辑华为云监视器时,从服务/资源类型下拉菜单中选择 DMS RabbitMQ,然后点击保存。
- 前往 Cloud > Huawei,选择已创建的华为云监视器,然后点击 DMS RabbitMQ 查看性能指标。
支持的指标
连接
指标名称 |
说明 |
单位 |
| Connections | 已建立到 RabbitMQ 实例的活跃连接总数。 | Count |
| Running Connections | 当前处于运行状态的连接数。 | Count |
| Flow Connections | 因资源压力而处于流量控制状态的连接数。 | Count |
| Blocked Connections | 当前被 Broker 阻塞的连接数。 | Count |
| Closed Connections | 当前处于关闭中状态的连接数。 | Count |
| Full Connections | 已达到最大容量的连接数。 | Count |
| Channels | 所有连接中已打开的活跃通道总数。 | Count |
| Running Channels | 当前处于运行状态的通道数。 | Count |
| Flow Channels | 当前处于流量控制状态的通道数。 | Count |
| Blocked Channels | 当前处于阻塞状态的通道数。 | Count |
| Closed Channels | 当前处于关闭中状态的通道数。 | Count |
| Queues | RabbitMQ 实例上当前声明的队列总数。 | Count |
| Running Queues | 当前处于运行状态的队列数。 | Count |
| Flow Queues | 当前处于流量控制状态的队列数。 | Count |
| Consumers | 当前订阅所有队列的消费者总数。 | Count |
消息
指标名称 |
说明 |
单位 |
| Available Messages | 当前已就绪、等待投递给消费者的消息数。 | Count |
| Unacknowledged Messages | 已投递给消费者但尚未确认的消息数。 | Count |
速率
指标名称 |
说明 |
单位 |
| Production Rate | 消息发布到 RabbitMQ 实例的速率。 | Count/second |
| Retrieval Rate (Manual Ack) | 消息投递给需要手动确认的消费者的速率。 | Count/second |
| Retrieval Rate (Auto Ack) | 消息投递给启用了自动确认的消费者的速率。 | Count/second |
阈值配置
您可以为所有 DMS RabbitMQ 指标配置阈值和告警,以主动检测性能下降或连接问题。
- 前往管理 > 配置文件 > 阈值和可用性。
- 为 DMS RabbitMQ 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
使用 Site24x7 的 IT 自动化解决 DMS RabbitMQ 常见的性能问题:
- 前往管理 > IT 自动化模板,然后点击添加自动化模板。
- 选择自动化类型(例如,服务器重启、清空队列)来创建自动化规则。
- 将创建的规则映射到 DMS RabbitMQ,以便在告警时自动执行。
配置规则
使用配置规则简化多个 DMS RabbitMQ 实例的批量设置。在发现新监视器时,自动分配阈值配置文件、通知配置文件、标签和监视器组。
