阿里云 RDS for PostgreSQL 监控集成
Site24x7 为阿里云 RDS for PostgreSQL 提供全面监控,实现对系统性能、资源消耗和复制健康状况的完整可见性。通过对 CPU 使用率、I/O 吞吐量、事务趋势和缓冲区使用情况的深入洞察,您可以及早发现瓶颈、优化查询性能并保持数据库稳定性。将阿里云账户与 Site24x7 集成后,所有 RDS for PostgreSQL 实例将自动被发现并受到监控。
使用案例
- 性能分析:追踪 CPU、I/O 和内存使用情况,检测过载进程并优化性能。
- 复制监控:识别复制延迟和重放延迟,以维护数据一致性。
- 连接可见性:监控活动、空闲和等待连接,避免连接饱和。
- 缓冲区和缓存优化:分析共享缓冲区命中率和缓存性能,以精细调整 PostgreSQL 配置。
- 自动化和告警:创建基于阈值的告警并自动化恢复,以减少宕机时间。
设置与配置
- 登录您的 Site24x7 账户并导航至云 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面,从服务类型列表中选择 RDS for PostgreSQL。
- 添加完成后,转至云 > 阿里云 > RDS for PostgreSQL 查看仪表板和性能指标。
支持的指标
CPU 使用率
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL 系统 CPU 使用率 | 系统级进程使用的 CPU 百分比。 | 百分比 |
| PostgreSQL 用户 CPU 使用率 | 用户级 PostgreSQL 进程使用的 CPU 百分比。 | 百分比 |
| PostgreSQL Postmaster CPU 使用率 | PostgreSQL postmaster 进程的 CPU 使用率百分比。 | 百分比 |
| PostgreSQL 后端 CPU 使用率 | 后端工作进程使用的 CPU 百分比。 | 百分比 |
| PostgreSQL BGWriter CPU 使用率 | 后台写入进程的 CPU 使用率百分比。 | 百分比 |
| PostgreSQL Checkpoint CPU 使用率 | 检查点操作期间消耗的 CPU 百分比。 | 百分比 |
| PostgreSQL Autovacuum CPU 使用率 | autovacuum 工作进程使用的 CPU 百分比。 | 百分比 |
| PostgreSQL 日志记录器 CPU 使用率 | PostgreSQL 日志记录器进程消耗的 CPU 百分比。 | 百分比 |
| PostgreSQL WAL Writer CPU 使用率 | WAL writer 进程的 CPU 使用率百分比。 | 百分比 |
| PostgreSQL WAL Sender CPU 使用率 | WAL sender 进程使用的 CPU 百分比。 | 百分比 |
| PostgreSQL 代理 CPU 使用率 | PostgreSQL 代理层的总 CPU 使用率百分比。 | 百分比 |
I/O 吞吐量
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL BGWorker I/O 吞吐量 | 后台工作进程产生的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL Checkpoint I/O 吞吐量 | 检查点操作期间的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL BGWriter I/O 吞吐量 | 后台写入活动产生的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL 启动 I/O 吞吐量 | 数据库启动期间的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL 日志记录器 I/O 吞吐量 | 日志操作产生的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL WAL Sender I/O 吞吐量 | WAL sender 进程产生的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL WAL Writer I/O 吞吐量 | WAL writer 进程产生的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL WAL Receiver I/O 吞吐量 | WAL receiver 进程处理的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL Autovacuum I/O 吞吐量 | autovacuum 活动产生的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL PGStat I/O 吞吐量 | 统计收集器进程的 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL 本地 I/O 吞吐量 | 本地磁盘总 I/O 吞吐量。 | 字节/秒 |
| PostgreSQL 本地 I/O 吞吐量(读取) | 本地磁盘读取吞吐量。 | 字节/秒 |
| PostgreSQL 本地 I/O 吞吐量(写入) | 本地磁盘写入吞吐量。 | 字节/秒 |
缓冲区与缓存
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL 共享缓冲区使用率 | 当前使用的共享缓冲区内存百分比。 | 百分比 |
| PostgreSQL 共享缓冲区命中次数 | 共享缓冲区缓存中记录的命中次数。 | 次 |
| PostgreSQL 共享缓冲区命中率 | 成功缓冲区命中次数与总查找次数之比的百分比。 | 百分比 |
| PostgreSQL 读取的块数 | PostgreSQL 读取的磁盘块数量。 | 次 |
事务与执行
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL 事务提交数 | 成功提交的事务数量。 | 次 |
| PostgreSQL 事务回滚数 | 回滚的事务数量。 | 次 |
| PostgreSQL 最大 SQL 执行时间 | 当前运行 SQL 查询的最大执行时间。 | 毫秒 |
| PostgreSQL 数据库年龄 | 数据库中最旧事务的年龄。 | 次 |
WAL 与检查点
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL 最大 Slot WAL 延迟 | WAL slot 中观察到的最大复制延迟。 | 毫秒 |
| PostgreSQL 本地 WAL 目录大小 | 本地 WAL 目录的总大小。 | 字节 |
网络与复制
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL 网络 RX | 数据库接收的入站网络流量。 | 字节/秒 |
| PostgreSQL 网络 TX | 数据库发送的出站网络流量。 | 字节/秒 |
| PostgreSQL 只读流复制状态 | 只读副本的流复制状态。 | 状态 |
| PostgreSQL 只读读取延迟 | 主节点与只读副本之间的读取延迟。 | 毫秒 |
| PostgreSQL 重放延迟 | WAL 重放与当前事务处理之间的延迟。 | 毫秒 |
连接数
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL 活动连接数 | 当前正在执行查询的活动连接数。 | 次 |
| PostgreSQL 空闲连接数 | 等待新任务的空闲连接数。 | 次 |
| PostgreSQL 等待连接数 | 等待资源或锁的连接数。 | 次 |
| PostgreSQL 总连接数 | 数据库连接总数(活动 + 空闲 + 等待)。 | 次 |
其他指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL Swell 时间 | 数据库经历内存压力或性能膨胀的总时间。 | 毫秒 |
| PostgreSQL 临时文件字节数 | 查询执行期间创建的临时文件总大小。 | 字节 |
阈值配置
- 转至管理 > 配置文件 > 阈值和可用性。
- 为 RDS for PostgreSQL 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具有助于自动解决性能下降问题。当发生违规时,告警引擎持续检查已定义阈值的系统事件,并执行已映射的自动化操作。
- 转至管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射到监视器以实现主动解决。
配置规则
通过 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。在添加新的 RDS for PostgreSQL 监视器时,自动应用这些设置。
