RabbitMQ AWS 监控
Amazon MQ 是一项托管消息代理服务,可帮助您轻松迁移到云端的消息代理。它支持 Apache ActiveMQ Classic 和 RabbitMQ 引擎类型。
概述
Site24x7 的 AWS 监控支持 Amazon MQ for ActiveMQ 和 Amazon MQ for RabbitMQ。本文档提供了 Site24x7 与 RabbitMQ 集成的详细概述,包括监控的指标和监视器数据。

RabbitMQ 是一个支持多种协议的开源消息代理。Site24x7 与 RabbitMQ 的集成可确保您的消息代理平稳运行,并帮助避免可能影响应用程序的问题。
除 RabbitMQ Broker 监视器外,该集成还提供以下两个子监视器:
- RabbitMQ Node:监控节点状态和连接情况,确保集群正常运行且节点间通信有效。
- RabbitMQ Queue:提供对消息队列整体效率的深入洞察,并监控其性能。
禁用 RabbitMQ Queue 自动发现
在 RabbitMQ 监视器的编辑监视器详情页面中,将禁用 RabbitMQ Queue 自动发现选项设置为是,可暂停所有 RabbitMQ Queue 监视器。默认情况下,此选项设置为否。
使用场景
将 RabbitMQ 与 Site24x7 集成,可实时了解您的 RabbitMQ 环境,帮助识别性能瓶颈,从而维护消息基础设施的可靠性、性能和安全性。
以某银行 Zylker 为例,当客户完成金融交易时,假设交易消息已发送,但由于某些应用程序问题导致消息未能从消息队列中清除。这可能给 Zylker 银行造成重大的财务损失和声誉损害。然而,如果该银行的 RabbitMQ 环境已与 Site24x7 集成,则可以主动管理交易,并根据队列中的消息数量或消费者数量配置阈值告警。这样,一旦发生阈值突破,系统将及时发出通知,Zylker 银行便可采取相应措施解决问题。
Site24x7 与 RabbitMQ 集成的优势
将 RabbitMQ 与 Site24x7 集成,可实现以下目标:
- 对 RabbitMQ 环境进行全面监控,优化基础设施的性能和可靠性。
- 深入了解消息代理、节点和队列的状态。
- 实现对所有队列数据流的关键可见性,并识别性能趋势。
- 对代理中的每个队列进行单独监控,并在出现异常行为时主动收到通知。
设置与配置
- 登录 Site24x7 帐户,将 Site24x7 创建为 IAM 用户,或创建跨账户 IAM 角色,以允许 Site24x7 访问您的 AWS 资源。
- 在集成 AWS 帐户页面,从待发现服务列表中选择 RabbitMQ。
权限
请确保 Site24x7 获得以下权限以监控 RabbitMQ:
- "mq:DescribeBroker"
- "mq:DescribeConfiguration"
- "mq:DescribeConfigurationRevision"
- "mq:DescribeUser"
- "mq:ListTags"
- "mq:ListBrokers"
- "mq:DescribeBrokerEngineTypes"
- "cloudwatch:ListMetrics"
- "logs:DescribeLogStreams"
- "logs:GetLogEvents"
轮询频率
Site24x7 根据设定的轮询频率(从每分钟一次到每天一次)查询 AWS 服务级别 API,以收集 RabbitMQ 监视器的指标。
支持的指标
各 RabbitMQ 监视器支持的指标如下所示。
RabbitMQ Broker
RabbitMQ Broker 监视器支持的指标如下:
| 指标名称 | 说明 | 统计方式 | 单位 |
|---|---|---|---|
| 系统 CPU 利用率 | 代理当前使用的已分配 Amazon EC2 计算单元百分比。 | 最大值 | 百分比 |
| 总内存使用率 | 根据 CloudWatch 指标中的已用内存和内存限制计算得出的内存使用百分比。 | 自定义 | 百分比 |
| Exchange 数量 | 代理上配置的 Exchange 总数。 | 最大值 | 个 |
| 队列数量 | 代理上配置的队列总数。 | 最大值 | 个 |
| 消息数量 | 队列中的消息总数。注:该数值为代理上所有就绪消息和未确认消息的总和。 | 最大值 | 个 |
| 就绪消息数量 | 队列中就绪消息的总数。 | 最大值 | 个 |
| 未确认消息数量 | 队列中未确认消息的总数。 | 最大值 | 个 |
| 消费者数量 | 连接到代理的消费者总数。 | 最大值 | 个 |
| 连接数量 | 在代理上建立的连接总数。 | 最大值 | 个 |
| Channel 数量 | 在代理上建立的 Channel 总数。 | 最大值 | 个 |
| 发布速率 | 消息发布到代理的速率。 | 最大值 | 个/秒 |
| 确认速率 | RabbitMQ 服务器确认已发布消息的速率。您可以将此指标与发布速率进行比较,以更好地了解代理的运行状况。 | 最大值 | 个/秒 |
| 消息应答速率 | 消费者应答消息的速率。 | 最大值 | 个/秒 |
| 内存限制 | RabbitMQ 代理的 RAM 限制。对于集群部署,此值表示所有三个 RabbitMQ 节点相应指标值的总和。 | 最大值 | 字节 |
| 已用内存 | RabbitMQ 代理使用的 RAM 量。 | 最大值 | 字节 |
| 磁盘空闲限制 | RabbitMQ 代理的磁盘限制。 | 最大值 | 字节 |
| 磁盘可用空间 | RabbitMQ 代理中可用磁盘空间总量。 | 最大值 | 字节 |
| I/O 读取平均时间 | RabbitMQ 执行一次读取操作的平均时间(毫秒),该值与消息大小成正比。 | 平均值 | 百分比/毫秒 |
| I/O 写入平均时间 | RabbitMQ 执行一次写入操作的平均时间(毫秒),该值与消息大小成正比。 | 平均值 | 百分比/毫秒 |
| 已用文件描述符数 | 已使用的文件描述符数量。 | 最大值 | 个 |
RabbitMQ Node
RabbitMQ Node 监视器支持的指标如下:
| 指标名称 | 说明 | 统计方式 | 单位 |
|---|---|---|---|
| 系统 CPU 利用率 | 代理当前使用的已分配 Amazon EC2 计算单元百分比。 | 最大值 | 百分比 |
| 总内存使用率 | 根据 CloudWatch 指标中的已用内存和内存限制计算得出的内存使用百分比。 | 自定义 | 百分比 |
| 内存限制 | RabbitMQ 节点的 RAM 限制。 | 最大值 | 字节 |
| 已用内存 | RabbitMQ 节点使用的 RAM 量。 | 最大值 | 字节 |
| 磁盘空闲限制 | RabbitMQ 节点的磁盘限制。 | 最大值 | 字节 |
| 磁盘可用空间 | RabbitMQ 节点中可用磁盘空间总量。 | 最大值 | 字节 |
| 已用文件描述符数 | 已使用的文件描述符数量。 | 最大值 | 个 |
RabbitMQ Queue
RabbitMQ Queue 监视器支持的指标如下:
| 指标名称 | 说明 | 统计方式 | 单位 |
|---|---|---|---|
| 消息数量 | 就绪消息数量和未确认消息数量的总和(即队列深度)。 | 最大值 | 个 |
| 消费者数量 | 订阅该队列的消费者数量。 | 最大值 | 个 |
| 就绪消息数量 | 当前可投递的消息数量。 | 最大值 | 个 |
| 未确认消息数量 | 服务器正在等待确认的消息数量。 | 最大值 | 个 |
阈值配置
为 RabbitMQ 监视器配置阈值:
- 登录 Site24x7 帐户,前往管理 > 配置文件 > 阈值和可用性。
- 点击添加阈值配置文件。
- 从监视器类型下拉菜单中选择适用的监视器类型,并在显示名称字段中填写合适的名称。可选的监视器类型包括 RabbitMQ Broker、RabbitMQ Queue 和 RabbitMQ Node。
- 在阈值配置部分将显示支持的指标,您可以为上述所有指标设置阈值。
- 点击保存。
您可以通过状态传播功能管理所有告警,确保通知通过父监视器发送。
许可
- RabbitMQ Broker:每个 RabbitMQ Broker 监视器使用一个基础监视器许可证。
- RabbitMQ Node:五个 RabbitMQ Node 监视器使用一个基础监视器许可证。
- RabbitMQ Queue:每个 RabbitMQ Queue 监视器使用一个基础监视器许可证。
查看 RabbitMQ 数据
要监控您的 RabbitMQ,请登录 Site24x7 帐户,前往云 > AWS > RabbitMQ。
RabbitMQ 监视器数据
各 RabbitMQ 监视器的数据如下所示。
RabbitMQ Broker
您可以在以下选项卡中查看 RabbitMQ Broker 数据。
摘要
摘要选项卡提供事件时间线和指标的全面概览,通过图表直观呈现 RabbitMQ 环境中代理实例和队列的性能与行为。
节点
在 RabbitMQ 中,节点是指在服务器或计算设备上运行的 RabbitMQ 消息代理实例。节点选项卡提供 RabbitMQ Node 监视器列表、可用性及状态信息。点击监视器名称超链接可查看 RabbitMQ Node 监视器数据。

队列
在 RabbitMQ 中,队列是存储消息的缓冲区。队列选项卡提供 RabbitMQ Queue 监视器列表、可用性及状态信息。点击监视器名称超链接可查看 RabbitMQ Queue 监视器数据。

配置
配置选项卡提供 RabbitMQ Broker 监视器的配置详情概览。
近期日志
近期日志选项卡提供最新生成的日志详情。
配置修订
配置修订选项卡提供配置变更的历史记录。
中断
中断选项卡提供中断事件的开始时间、结束时间、持续时长及备注(如有)等详情。
资产清单
从资产清单选项卡可获取资源名称、区域、监视器许可类别等详细信息。阈值和可用性配置文件及通知配置文件可根据用户需求进行设置,并在此选项卡中查看。
日志报表
此选项卡提供 RabbitMQ Broker 监视器日志状态的汇总报表,可下载为 CSV 文件。
RabbitMQ Node
您可以在以下选项卡中查看 RabbitMQ Node 数据。

摘要
摘要选项卡提供事件时间线和指标的全面概览,通过图表直观呈现 RabbitMQ 环境中节点的性能与行为。
配置
配置选项卡显示 RabbitMQ Node 监视器的配置详情。
中断
中断选项卡提供中断事件的开始时间、结束时间、持续时长及备注(如有)等详情。
资产清单
从资产清单选项卡可获取资源名称、区域、监视器许可类别等详细信息。阈值和可用性配置文件及通知配置文件可根据用户需求进行设置,并在此选项卡中查看。
日志报表
此选项卡提供 RabbitMQ Node 监视器日志状态的汇总报表,可下载为 CSV 文件。
RabbitMQ Queue
您可以在以下选项卡中查看 RabbitMQ Queue 数据。

摘要
摘要选项卡提供事件时间线和指标的全面概览,通过图表直观呈现 RabbitMQ 环境中队列实例的性能与行为。
配置
配置选项卡显示 RabbitMQ Queue 监视器的配置详情。
中断
中断选项卡提供中断事件的开始时间、结束时间、持续时长及备注(如有)等详情。
资产清单
从资产清单选项卡可获取资源名称、区域、监视器许可类别等详细信息。阈值和可用性配置文件及通知配置文件可根据用户需求进行设置,并在此选项卡中查看。
日志报表
此选项卡提供 RabbitMQ Queue 监视器日志状态的汇总报表,可下载为 CSV 文件。
