如何在华为云中监控 DMS RocketMQ
Site24x7 持续监控您的 DMS RocketMQ 指标,为您的团队提供对各 RocketMQ 实例消息生产和消费吞吐量、存储利用率以及限流活动的实时可见性。
使用场景
积压控制:不断上升的实例积压数量表明消费者正在落后于生产者。为积压阈值设置告警,以便在积压耗尽保留窗口之前扩展消费者组或排查处理缓慢的问题。
存储保障:同时追踪实例磁盘使用率和实例保留期,以监控存储相对于保留窗口的消耗速度。
限流洞察:实例生产和消费速率限制百分比显示与配置上限的接近程度,而限流次数则量化了主动限流的情况。同时监控两者,以便在限流影响应用程序吞吐量之前调整速率限制策略。
设置与配置
DMS RocketMQ 资源在华为云集成期间将被自动发现和监控。如需启用监控,请按照以下步骤操作:
- 进入云 > 华为 > 添加华为监视器。按步骤添加华为云监视器。
- 在添加或编辑华为云监视器时,从"服务/资源类型"下拉菜单中选择 DMS RocketMQ,然后单击保存。
- 进入云 > 华为,选择已创建的华为监视器,然后单击 DMS RocketMQ。
支持的指标
消息
指标名称 |
描述 |
单位 |
| Instance Produce Messages | RocketMQ 实例生产的消息总数。 | Count |
| Instance Consume Messages | RocketMQ 实例消费的消息总数。 | Count |
| Instance Accumulation | 已积压且尚未被消费者组消费的消息数量。 | Count |
| Instance Produce Scheduled Messages | RocketMQ 实例生产的定时消息总数。 | Count |
常规
指标名称 |
描述 |
单位 |
| Current Topics | RocketMQ 实例上当前活跃的主题总数。 | Count |
| Current Queues | 实例上所有主题中当前活跃的消息队列总数。 | Count |
存储
指标名称 |
描述 |
单位 |
| Instance Disk Usage | RocketMQ 实例当前使用的磁盘容量百分比。 | Percentage |
| Instance Retention Period | 消息在 RocketMQ 实例上过期前的保留时长。 | Hour |
速率
指标名称 |
描述 |
单位 |
| Instance Produce Rate | 向 RocketMQ 实例生产消息的速率。 | Count/second |
| Instance Consume Rate | 从 RocketMQ 实例消费消息的速率。 | Count/second |
| Instance Produce Rate For Rate Limit | 用于评估速率限制阈值的生产消息速率。 | Count/second |
| Instance Consume Rate For Rate Limit | 用于评估速率限制阈值的消费消息速率。 | Count/second |
速率限制
指标名称 |
描述 |
单位 |
| Instance Produce Rate Limit Percentage | 已使用的配置生产速率限制百分比。 | Percentage |
| Instance Consume Rate Limit Percentage | 已使用的配置消费速率限制百分比。 | Percentage |
| Instance Produce Rate Limit Times | RocketMQ 实例上触发生产速率限制的次数。 | Count |
| Instance Consume Rate Limit Times | RocketMQ 实例上触发消费速率限制的次数。 | Count |
阈值配置
您可以为所有 DMS RocketMQ 指标配置阈值和告警,以主动检测性能下降或连接问题。
- 进入管理 > 配置文件 > 阈值和可用性。
- 为 DMS RocketMQ 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
使用 Site24x7 的 IT 自动化解决 DMS RocketMQ 性能的常见问题:
- 进入管理 > IT 自动化模板,然后单击添加自动化模板。
- 通过选择自动化"类型"(例如:服务器重启、清除队列)创建自动化规则。
- 将创建的规则映射到 DMS RocketMQ,以便在告警时自动执行。
配置规则
使用配置规则简化多个 DMS RocketMQ 实例的批量配置。在发现新监视器时,自动分配阈值配置文件、通知配置文件、标签和监视器组。
