如何在华为云中监控 RDS PostgreSQL
Site24x7 监控华为云中的 RDS PostgreSQL 环境,提供 CPU、内存、磁盘 I/O、连接数、复制延迟和查询性能等方面的深度洞察。这些信息可帮助您及早发现瓶颈,确保数据库操作的稳定可靠。
使用场景
复制安全:通过监控复制延迟和复制槽增长来降低故障转移风险。这确保从节点保持同步,并防止 Write-Ahead Logging (WAL) 积压。
TXID 保护:通过监控事务 ID 的使用情况并在达到关键限制前及时执行 VACUUM 操作,防止意外关机。
查询性能:通过追踪慢查询和整体吞吐量来降低延迟。这有助于在低效查询对用户产生负面影响之前将其识别出来。
设置与配置
在华为云集成期间,RDS PostgreSQL 资源将被自动发现并受到监控。要启用监控,请按照以下步骤操作:
- 导航至云监控 > 华为 > 添加华为监视器。按照步骤添加华为云监视器。
- 在添加或编辑华为云监视器时,从服务/资源类型下拉菜单中选择 RDS PostgreSQL,然后点击保存。
- 导航至云监控 > 华为,选择已创建的华为监视器,点击 RDS PostgreSQL 查看性能指标。
支持的指标
CPU 与内存
指标名称 | 描述 | 单位 |
| CPU Utilization | RDS PostgreSQL 实例当前消耗的 CPU 容量百分比。 | Percentage |
| Memory Utilization | RDS PostgreSQL 实例当前消耗的内存容量百分比。 | Percentage |
| Swap Usage | 实例当前消耗的 Swap 空间百分比。 | Percentage |
网络
指标名称 | 描述 | 单位 |
| Network Input Throughput | 实例每秒通过网络接收的数据速率。 | Byte/second |
| Network Output Throughput | 实例每秒通过网络发送的数据速率。 | Byte/second |
连接数
指标名称 | 描述 | 单位 |
| Database Connections | 当前建立到 PostgreSQL 实例的连接总数。 | Count |
| Active Connections | 当前正在执行查询或操作的连接数。 | Count |
| Connection Usage | 当前可用连接容量的使用百分比。 | Percentage |
查询与事务
指标名称 | 描述 | 单位 |
| Queries Per Second | 实例每秒执行的查询语句速率。 | Count/second |
| Transactions Per Second | 实例每秒提交的事务速率。 | Count/second |
| Maximum Used Transaction IDs | 当前消耗的事务 ID 最大数量,表示事务 ID 回卷风险。 | Count |
| Slow SQL (1 Second) | 执行时间超过 1 秒的 SQL 语句数量。 | Count |
复制
指标名称 | 描述 | 单位 |
| Replication Lag | 主节点与从节点应用复制数据之间的延迟。 | Millisecond |
| Oldest Replication Slot Lag | 为最旧的复制槽保留的 WAL 数据量。 | MB |
| Transaction Logs Usage | 实例上当前消耗的事务日志总大小。 | MB |
| Transaction Logs Generation Rate | 每秒生成新事务日志的速率。 | MB/second |
| WAL Size | 实例上当前存储的 Write-Ahead Log 数据总大小。 | GB |
磁盘与 I/O
指标名称 | 描述 | 单位 |
| IOPS | 磁盘每秒处理的读写 I/O 操作数。 | Count |
| Disk Utilization | 实例当前消耗的总磁盘存储百分比。 | Percentage |
| Disk Total Size | 为实例预配的磁盘存储总容量。 | GB |
| Disk Used Size | 实例当前消耗的磁盘存储总量。 | GB |
| Disk Read Throughput | 每秒从磁盘读取的数据速率。 | Byte/second |
| Disk Write Throughput | 每秒写入磁盘的数据速率。 | Byte/second |
| Disk I/O Usage | 当前磁盘 I/O 容量的使用百分比。 | Percentage |
阈值配置
您可以为所有 RDS PostgreSQL 指标配置阈值和告警,以主动检测性能下降或连接问题。
- 前往管理 > 配置文件 > 阈值与可用性。
- 为 RDS PostgreSQL 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
使用 Site24x7 的 IT 自动化来解决 RDS PostgreSQL 性能的常见问题:
- 前往管理 > IT 自动化模板,然后点击添加自动化模板。
- 通过选择自动化类型(例如,服务器重启、清除队列)来创建自动化规则。
- 将创建的规则映射到 RDS PostgreSQL,以在告警时自动执行。
配置规则
使用配置规则简化 RDS PostgreSQL 实例的批量设置。在发现新监视器时,自动分配阈值配置文件、通知配置文件、标签和监视器组。
