帮助手册

RabbitMQ AWS 监控

Amazon MQ 是一项托管消息代理服务,可帮助您轻松迁移到云端的消息代理。它支持 Apache ActiveMQ Classic 和 RabbitMQ 引擎类型。 

概述

Site24x7 的 AWS 监控支持 Amazon MQ for ActiveMQ 和 Amazon MQ for RabbitMQ。本文档提供了 Site24x7 与 RabbitMQ 集成的详细概述,包括监控的指标和监视器数据。

RabbitMQ 是一个支持多种协议的开源消息代理。Site24x7 与 RabbitMQ 的集成可确保您的消息代理平稳运行,并帮助避免可能影响应用程序的问题。 

RabbitMQ Broker 监视器外,该集成还提供以下两个子监视器:

  • RabbitMQ Node:监控节点状态和连接情况,确保集群正常运行且节点间通信有效。 
  • RabbitMQ Queue:提供对消息队列整体效率的深入洞察,并监控其性能。 
注意

禁用 RabbitMQ Queue 自动发现

在 RabbitMQ 监视器的编辑监视器详情页面中,将禁用 RabbitMQ Queue 自动发现选项设置为,可暂停所有 RabbitMQ Queue 监视器。默认情况下,此选项设置为。 

使用场景

将 RabbitMQ 与 Site24x7 集成,可实时了解您的 RabbitMQ 环境,帮助识别性能瓶颈,从而维护消息基础设施的可靠性、性能和安全性。

以某银行 Zylker 为例,当客户完成金融交易时,假设交易消息已发送,但由于某些应用程序问题导致消息未能从消息队列中清除。这可能给 Zylker 银行造成重大的财务损失和声誉损害。然而,如果该银行的 RabbitMQ 环境已与 Site24x7 集成,则可以主动管理交易,并根据队列中的消息数量或消费者数量配置阈值告警。这样,一旦发生阈值突破,系统将及时发出通知,Zylker 银行便可采取相应措施解决问题。

Site24x7 与 RabbitMQ 集成的优势

将 RabbitMQ 与 Site24x7 集成,可实现以下目标:

  • 对 RabbitMQ 环境进行全面监控,优化基础设施的性能和可靠性。
  • 深入了解消息代理、节点和队列的状态。
  • 实现对所有队列数据流的关键可见性,并识别性能趋势。
  • 对代理中的每个队列进行单独监控,并在出现异常行为时主动收到通知。

设置与配置

  • 登录 Site24x7 帐户,将 Site24x7 创建为 IAM 用户,或创建跨账户 IAM 角色,以允许 Site24x7 访问您的 AWS 资源。
  • 集成 AWS 帐户页面,从待发现服务列表中选择 RabbitMQ

权限

请确保 Site24x7 获得以下权限以监控 RabbitMQ:

  • "mq:DescribeBroker"
  • "mq:DescribeConfiguration"
  • "mq:DescribeConfigurationRevision"
  • "mq:DescribeUser"
  • "mq:ListTags"
  • "mq:ListBrokers"
  • "mq:DescribeBrokerEngineTypes"
  • "cloudwatch:ListMetrics"
  • "logs:DescribeLogStreams"
  • "logs:GetLogEvents"

轮询频率

Site24x7 根据设定的轮询频率(从每分钟一次到每天一次)查询 AWS 服务级别 API,以收集 RabbitMQ 监视器的指标。

支持的指标

各 RabbitMQ 监视器支持的指标如下所示。

RabbitMQ Broker

RabbitMQ Broker 监视器支持的指标如下:

指标名称 说明 统计方式 单位
系统 CPU 利用率 代理当前使用的已分配 Amazon EC2 计算单元百分比。 最大值 百分比
总内存使用率 根据 CloudWatch 指标中的已用内存和内存限制计算得出的内存使用百分比。 自定义 百分比
Exchange 数量 代理上配置的 Exchange 总数。 最大值
队列数量 代理上配置的队列总数。 最大值
消息数量 队列中的消息总数。注:该数值为代理上所有就绪消息和未确认消息的总和。 最大值
就绪消息数量 队列中就绪消息的总数。 最大值
未确认消息数量 队列中未确认消息的总数。 最大值
消费者数量 连接到代理的消费者总数。 最大值
连接数量 在代理上建立的连接总数。 最大值
Channel 数量 在代理上建立的 Channel 总数。 最大值
发布速率 消息发布到代理的速率。 最大值 个/秒
确认速率 RabbitMQ 服务器确认已发布消息的速率。您可以将此指标与发布速率进行比较,以更好地了解代理的运行状况。 最大值 个/秒
消息应答速率 消费者应答消息的速率。 最大值 个/秒
内存限制 RabbitMQ 代理的 RAM 限制。对于集群部署,此值表示所有三个 RabbitMQ 节点相应指标值的总和。 最大值 字节
已用内存 RabbitMQ 代理使用的 RAM 量。 最大值 字节
磁盘空闲限制 RabbitMQ 代理的磁盘限制。 最大值 字节
磁盘可用空间 RabbitMQ 代理中可用磁盘空间总量。 最大值 字节
I/O 读取平均时间 RabbitMQ 执行一次读取操作的平均时间(毫秒),该值与消息大小成正比。 平均值 百分比/毫秒
I/O 写入平均时间 RabbitMQ 执行一次写入操作的平均时间(毫秒),该值与消息大小成正比。 平均值 百分比/毫秒
已用文件描述符数 已使用的文件描述符数量。 最大值

RabbitMQ Node

RabbitMQ Node 监视器支持的指标如下:

指标名称 说明 统计方式 单位
系统 CPU 利用率 代理当前使用的已分配 Amazon EC2 计算单元百分比。 最大值 百分比
总内存使用率 根据 CloudWatch 指标中的已用内存和内存限制计算得出的内存使用百分比。 自定义 百分比
内存限制 RabbitMQ 节点的 RAM 限制。 最大值 字节
已用内存 RabbitMQ 节点使用的 RAM 量。 最大值 字节
磁盘空闲限制 RabbitMQ 节点的磁盘限制。 最大值 字节
磁盘可用空间 RabbitMQ 节点中可用磁盘空间总量。 最大值 字节
已用文件描述符数 已使用的文件描述符数量。 最大值

RabbitMQ Queue

RabbitMQ Queue 监视器支持的指标如下:

指标名称 说明 统计方式 单位
消息数量 就绪消息数量和未确认消息数量的总和(即队列深度)。 最大值
消费者数量 订阅该队列的消费者数量。 最大值
就绪消息数量 当前可投递的消息数量。 最大值
未确认消息数量 服务器正在等待确认的消息数量。 最大值

阈值配置

为 RabbitMQ 监视器配置阈值:

  1. 登录 Site24x7 帐户,前往管理 > 配置文件 > 阈值和可用性
  2. 点击添加阈值配置文件
  3. 监视器类型下拉菜单中选择适用的监视器类型,并在显示名称字段中填写合适的名称。可选的监视器类型包括 RabbitMQ BrokerRabbitMQ QueueRabbitMQ Node
  4. 阈值配置部分将显示支持的指标,您可以为上述所有指标设置阈值。
  5. 点击保存
注意

您可以通过状态传播功能管理所有告警,确保通知通过父监视器发送。

许可

  • RabbitMQ Broker:每个 RabbitMQ Broker 监视器使用一个基础监视器许可证
  • RabbitMQ Node:五个 RabbitMQ Node 监视器使用一个基础监视器许可证。
  • RabbitMQ Queue:每个 RabbitMQ Queue 监视器使用一个基础监视器许可证。

查看 RabbitMQ 数据

要监控您的 RabbitMQ,请登录 Site24x7 帐户,前往 > AWS >  RabbitMQ

RabbitMQ 监视器数据

各 RabbitMQ 监视器的数据如下所示。

RabbitMQ Broker

您可以在以下选项卡中查看 RabbitMQ Broker 数据。

摘要

摘要选项卡提供事件时间线和指标的全面概览,通过图表直观呈现 RabbitMQ 环境中代理实例和队列的性能与行为。

节点

在 RabbitMQ 中,节点是指在服务器或计算设备上运行的 RabbitMQ 消息代理实例。节点选项卡提供 RabbitMQ Node 监视器列表、可用性及状态信息。点击监视器名称超链接可查看 RabbitMQ Node 监视器数据。

队列

在 RabbitMQ 中,队列是存储消息的缓冲区。队列选项卡提供 RabbitMQ Queue 监视器列表、可用性及状态信息。点击监视器名称超链接可查看 RabbitMQ Queue 监视器数据。

配置

配置选项卡提供 RabbitMQ Broker 监视器的配置详情概览。

近期日志

近期日志选项卡提供最新生成的日志详情。

配置修订

配置修订选项卡提供配置变更的历史记录。

中断

中断选项卡提供中断事件的开始时间、结束时间、持续时长及备注(如有)等详情。

资产清单

资产清单选项卡可获取资源名称、区域、监视器许可类别等详细信息。阈值和可用性配置文件通知配置文件可根据用户需求进行设置,并在此选项卡中查看。

日志报表

此选项卡提供 RabbitMQ Broker 监视器日志状态的汇总报表,可下载为 CSV 文件。

RabbitMQ Node

您可以在以下选项卡中查看 RabbitMQ Node 数据。

摘要

摘要选项卡提供事件时间线和指标的全面概览,通过图表直观呈现 RabbitMQ 环境中节点的性能与行为。

配置

配置选项卡显示 RabbitMQ Node 监视器的配置详情。

中断

中断选项卡提供中断事件的开始时间、结束时间、持续时长及备注(如有)等详情。

资产清单

资产清单选项卡可获取资源名称、区域、监视器许可类别等详细信息。阈值和可用性配置文件通知配置文件可根据用户需求进行设置,并在此选项卡中查看。

日志报表

此选项卡提供 RabbitMQ Node 监视器日志状态的汇总报表,可下载为 CSV 文件。

RabbitMQ Queue

您可以在以下选项卡中查看 RabbitMQ Queue 数据。

摘要

摘要选项卡提供事件时间线和指标的全面概览,通过图表直观呈现 RabbitMQ 环境中队列实例的性能与行为。

配置

配置选项卡显示 RabbitMQ Queue 监视器的配置详情。

中断

中断选项卡提供中断事件的开始时间、结束时间、持续时长及备注(如有)等详情。

资产清单

资产清单选项卡可获取资源名称、区域、监视器许可类别等详细信息。阈值和可用性配置文件通知配置文件可根据用户需求进行设置,并在此选项卡中查看。

日志报表

此选项卡提供 RabbitMQ Queue 监视器日志状态的汇总报表,可下载为 CSV 文件。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!