帮助手册

如何监控华为云 DMS RabbitMQ

Site24x7 持续监控您的 DMS RabbitMQ 指标,为您的团队提供对连接和通道健康状况、消息队列深度以及消息生产和投递速率的实时可见性。

提前发现消费者滞后、Broker 流量控制和队列瓶颈,确保消息基础设施稳定运行。

使用场景

防止消费者滞后:未确认消息数上升而消费速率下降,表明消费者处理速度跟不上。对未确认消息数设置告警,在积压导致延迟或内存压力之前及时扩容消费者。

流量控制检测:Flow阻塞连接数表明 Broker 因资源压力(如内存或磁盘使用率过高)正在对发布者进行流量限制。实时监控这些状态,在生产者丢弃消息或超时之前进行干预。

队列诊断:对比运行中流控中的队列数以及运行中阻塞通道数,判断瓶颈是源于消费者处理过慢、消息体积过大,还是 Broker 资源不足。

设置与配置

在华为云集成过程中,DMS RabbitMQ 资源将被自动发现并监控。如需启用监控,请按照以下步骤操作:

  1. 前往 Cloud > Huawei > Add Huawei Monitor,了解如何添加华为云监视器
  2. 在添加或编辑华为云监视器时,从服务/资源类型下拉菜单中选择 DMS RabbitMQ,然后点击保存
  3. 前往 Cloud > Huawei,选择已创建的华为云监视器,然后点击 DMS RabbitMQ 查看性能指标。

支持的指标

连接

指标名称

说明

单位

Connections已建立到 RabbitMQ 实例的活跃连接总数。Count
Running Connections当前处于运行状态的连接数。Count
Flow Connections因资源压力而处于流量控制状态的连接数。Count
Blocked Connections当前被 Broker 阻塞的连接数。Count
Closed Connections当前处于关闭中状态的连接数。Count
Full Connections已达到最大容量的连接数。Count
Channels所有连接中已打开的活跃通道总数。Count
Running Channels当前处于运行状态的通道数。Count
Flow Channels当前处于流量控制状态的通道数。Count
Blocked Channels当前处于阻塞状态的通道数。Count
Closed Channels当前处于关闭中状态的通道数。Count
QueuesRabbitMQ 实例上当前声明的队列总数。Count
Running Queues当前处于运行状态的队列数。Count
Flow Queues当前处于流量控制状态的队列数。Count
Consumers当前订阅所有队列的消费者总数。Count

消息

指标名称

说明

单位

Available Messages 当前已就绪、等待投递给消费者的消息数。 Count
Unacknowledged Messages 已投递给消费者但尚未确认的消息数。 Count

速率

指标名称

说明

单位

Production Rate 消息发布到 RabbitMQ 实例的速率。 Count/second
Retrieval Rate (Manual Ack) 消息投递给需要手动确认的消费者的速率。 Count/second
Retrieval Rate (Auto Ack) 消息投递给启用了自动确认的消费者的速率。 Count/second

阈值配置

您可以为所有 DMS RabbitMQ 指标配置阈值和告警,以主动检测性能下降或连接问题。

  1. 前往管理 > 配置文件 > 阈值和可用性
  2. DMS RabbitMQ 创建或编辑阈值配置文件
  3. 将配置文件分配给相应的监视器以触发告警。

IT 自动化

使用 Site24x7 的 IT 自动化解决 DMS RabbitMQ 常见的性能问题:

  1. 前往管理 > IT 自动化模板,然后点击添加自动化模板
  2. 选择自动化类型(例如,服务器重启、清空队列)来创建自动化规则。
  3. 将创建的规则映射到 DMS RabbitMQ,以便在告警时自动执行。

配置规则

使用配置规则简化多个 DMS RabbitMQ 实例的批量设置。在发现新监视器时,自动分配阈值配置文件通知配置文件标签和监视器组。

相关文章

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!