Amazon MQ 监控集成
Amazon MQ 是一项消息传递服务,可帮助各应用程序和组件之间传递消息。借助 Site24x7 的集成,您可以监控 Amazon MQ 服务,全面了解所有代理和目标的指标。
为简化您的监控体验,针对 MQ 监控的组件被分类为四种监视器:
- Amazon MQ Broker
- Amazon MQ Topic
- Amazon MQ Queue
- Amazon MQ Network Connector
设置与配置
- 如果您尚未完成,请通过以下方式之一启用 AWS 账户与 Site24x7 AWS 账户之间的访问权限:
- 将 Site24x7 创建为 IAM 用户。
- 创建跨账户 IAM 角色。了解更多。
- 在集成 AWS 账户页面上,勾选 Amazon MQ 旁边的复选框。了解更多。
策略与权限
Site24x7 使用各种 Amazon MQ API 来收集消息服务的信息。请将 AWS 托管策略 ReadOnlyAccess 分配给 Site24x7 实体(IAM 用户或 IAM 角色),以帮助 Site24x7 收集指标和元数据。如果您希望分配自定义策略,请确保策略 JSON 中包含以下读取级别操作。了解更多。
- "mq:DescribeBroker",
- "mq:DescribeConfiguration",
- "mq:DescribeConfigurationRevision",
- "mq:DescribeUser",
- "mq:ListTags",
- "mq:ListBrokers",
- "mq:DescribeBrokerEngineTypes",
- "cloudwatch:ListMetrics",
- "logs:DescribeLogStreams",
- "logs:GetLogEvents"
轮询频率
Site24x7 按照设定的轮询频率收集集群、命名空间和节点的指标数据,频率范围为一分钟到一天。了解更多。
IT 自动化
您可以为 Site24x7 支持的 AWS 服务添加自动化。登录 Site24x7,转到管理 > IT 自动化模板 (+) > 添加自动化模板。添加自动化后,您可以安排这些自动化依次执行。
您现在可以使用 Amazon MQ 自动化自动重启 Amazon MQ 代理。
许可
每个客户自管理的 Amazon MQ 将被视为一个基础监视器,Amazon MQ Network Connector 除外。对于 Amazon MQ Network Connector,每五个监视器消耗一个基础监视器许可。
性能指标
| CloudWatch 指标 | 描述 | 统计 | 单位 |
| Burst Balance | 底层存储层 Amazon EBS 卷突增积分的剩余百分比 | Average | Percent |
| Cpu Credit Balance | 实例自启动或开始运行以来累积的 CPU 积分数量(包括启动积分)。积分余额可供代理实例用于超越基准 CPU 使用率的突增操作 | Minimum | Credits |
| Cpu Utilization | 代理当前使用的已分配 Amazon EC2 计算单元百分比 | Maximum | Percent |
| Current Connections Count | 当前代理上的活动连接数量。 | Maximum | Count |
| Established Connections Count | 代理上已建立的连接总数,包括活动连接和非活动连接。 | Maximum | Count |
| Heap Usage | 代理当前使用的 ActiveMQ JVM 内存限制百分比。 | Maximum | Percent |
| Network In | 代理的入站流量。 | Sum | MB |
| Network Out | 代理的出站流量。 | Sum | MB |
| Open Transaction Count | 正在进行的事务总数。 | Maximum | Count |
| Store Percent Usage | 存储限制的使用百分比。达到 100 时,代理将拒绝消息。 | Average | Percent |
| Inactive Durable Topic Subscribers Count | 非活动持久主题订阅者的数量,最多 2000 个。 | Sum | Count |
| Journal Files For Fast Recovery | 干净关闭后将重播的日志文件数量。 | Sum | Count |
| Journal Files For Full Recovery | 非干净关闭后将重播的日志文件数量。 | Sum | Count |
| Total Consumer Count | 订阅当前代理上目标的消息消费者数量。 | Maximum | Count |
| Total Message Count | 存储在代理上的消息数量。 | Maximum | Count |
| Total Producer Count | 在当前代理目标上活动的消息生产者数量。 | Maximum | Count |
| Volume Read Ops | 在 Amazon EBS 卷上执行的读取操作数量。 | Sum | Count |
| Volume Write Ops | 在 Amazon EBS 卷上执行的写入操作数量。 | Sum | Count |
| Total Enqueue Count | 已发送到代理的消息总数。 | Sum | Count |
| Total Dequeue Count | 客户端已消费的消息总数。 | Sum | Count |
队列和主题的指标
| CloudWatch 指标 | 描述 | 统计 | 单位 |
| Consumer Count | 订阅目标的消费者数量。 | Maximum | Count |
| Enqueue Time | 消息从到达代理到传递给消费者的端到端延迟。 | Maximum | Time(millisecond) |
| Expired Count | 每分钟因过期而无法送达的消息数量。 | Sum | Count |
| Dispatch Count | 每分钟发送给消费者的消息数量。 | Sum | Count |
| Inflight Count | 已发送给消费者但尚未确认的消息数量。 | Sum | Count |
| Memory Usage | 目标当前使用的内存限制百分比。 | Average | Percent |
| Producer Count | 目标的生产者数量。 | Maximum | Count |
| Queue Size | 队列中的消息数量。注意:此指标仅适用于 Queue。 | Maximum | Count |
网络连接器指标
| CloudWatch 指标 | 描述 | 统计 | 单位 |
| Enqueue Count | 每分钟发送到目标的消息数量。 | Maximum | Count |
| Dequeue Count | 每分钟由消费者确认的消息数量。 | Sum | Count |
| Receive Count | 通过双工网络连接器从远程代理接收的消息数量。 | Sum | Count |
阈值配置
转到管理 > 配置文件 > 阈值与可用性 (+) > 选择监视器类型为 Amazon MQ Broker/Amazon MQ Topic/Amazon MQ Queue/Amazon MQ Network Connector。您可以为上述所有指标设置阈值。此外,对于 Amazon MQ Queue 和 Amazon MQ Topic 监视器,您可以在阈值表单中选择静默非活动告警。
拓扑视图
Topology View 标签页提供实时的以资源为中心的依赖关系图。它能动态追踪您的 Amazon MQ 资源与周边 AWS 基础设施的实时连接关系,在告警触发时加快根本原因定位。如果任何关联组件处于严重状态,该组件将在拓扑视图中相应标记,并显示中断原因,让您无需离开监视器页面即可精确定位故障点。与账户级拓扑视图不同,此标签页将可视化范围限定在单个资源,以精确回答:此 Amazon MQ 资源连接到哪些对象,以及该资源发生故障时会影响什么?您可以从单个资源向上追踪完整的依赖链,直至其主要父实体、服务类型、区域和 AWS 账户层级。
拓扑还扩展至关联的子监视器,包括 Amazon MQ Broker、Amazon MQ Topic、Amazon MQ Queue 和 Amazon MQ Network Connector,让您可以在一处查看所有相关组件的依赖关系。您可以从单个资源向上追踪完整的依赖链,直至其主要父实体、服务类型、区域和 AWS 账户层级。
预测
预测以下性能指标的未来值,以便在扩充容量或扩展 AWS 基础设施方面做出明智决策。
- CPU Utilization
- Heap Usage
- Store Percent Usage
- Total Enqueue Count
- Total Dequeue Count
- Volume Read Ops
- Volume Write Ops
同样,您也可以查看以下 Amazon MQ 队列和主题指标的预测:
- Inflight Count
- Memory Usage
Site24x7 的 Amazon MQ 监控界面
Summary
通过时间序列图表获取每个资源中发生的各类事件的概览。这些图表提供 CPU 积分余额、CPU 使用率、当前连接数、已建立连接数、堆内存使用率和网络吞吐量等方面的事件时间线,以及更多信息。所有时间序列图表均列出平均值、最小值和最大值。
Topology View
Topology 标签页提供实时的资源级视图,展示您的 Amazon MQ 与其他 AWS 组件的连接关系,帮助您快速了解依赖关系和影响范围。
Monitored Resources
在 Monitored Resources 标签页上,您可以查看 Amazon MQ 环境中的 Amazon MQ 主题、队列和网络连接器列表。点击单个列表项可查看与该资源关联的性能和资源使用统计信息。您还可以通过点击操作下的铅笔图标设置阈值,并在任何服务发生故障时收到通知。
Logs
收集选定日志类型的 Amazon MQ 日志条目,日志从 CloudWatch 获取。最近日志标签页包含审计日志和常规日志。
Configuration
此标签页提供 Amazon MQ 的配置详情,包括代理引擎类型、代理实例类型、部署类型、终端节点 URL、安全组等信息。
Outages
Outages 标签页显示宕机、故障、严重或维护历史记录列表,并提供中断的开始时间、结束时间、持续时间及备注(如有)。
Inventory
此处设置每个证书阈值的配置详情。可设置的各种阈值参数包括证书有效期,以及证书到期前的小时数、分钟数或天数。轮询频率和通知配置文件可按用户设置并在此处查看。
