阿里云 PolarDB PostgreSQL 版监控集成
Site24x7 为阿里云 PolarDB PostgreSQL 版提供全面监控,可深入了解计算资源、内存、I/O 吞吐量、会话活动和事务性能。将阿里云账户与 Site24x7 集成后,所有 PolarDB PostgreSQL 版实例将被自动发现并进行监控。
使用场景
- 资源优化:监控 CPU、内存和 I/O 利用率,防止资源瓶颈。
- 性能监控:跟踪 TPS、QPS、慢查询和长时间运行的事务,以优化工作负载。
- 连接管理:分析活跃、空闲和总连接数,防止会话饱和。
- 复制与延迟洞察:检测复制延迟和事务延迟,确保数据一致性。
- 自动化与告警:配置阈值和 IT 自动化以进行主动修复。
设置与配置
- 登录您的 Site24x7 账户,导航至云监控 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面,从服务类型列表中选择 PolarDB PostgreSQL 版。
- 添加后,前往云监控 > 阿里云 > PolarDB PostgreSQL 版,查看仪表板和性能指标。
支持的指标
计算与内存
| 指标名称 | 描述 | 单位 |
|---|---|---|
| 集群 CPU 利用率 | 集群的 CPU 利用率百分比。 | 百分比 |
| 集群内存利用率 | 集群使用的内存百分比。 | 百分比 |
| 总 CPU 使用率 | 集群的总 CPU 使用率。 | 百分比 |
| 内存使用率 | 集群的总内存使用率。 | 百分比 |
| 按 CPU 核心划分的集群 PCU | 集群中每个 CPU 核心的 CPU 使用率。 | 百分比 |
| 集群代理 CPU 利用率 | 集群代理层的 CPU 利用率。 | 百分比 |
磁盘与 I/O
| 指标名称 | 描述 | 单位 |
|---|---|---|
| 集群 IOPS | 集群每秒 I/O 操作总次数。 | 次/秒 |
| 集群 IOPS 使用率 | IOPS 利用率百分比。 | 百分比 |
| 集群磁盘利用率 | 各集群节点的磁盘空间利用率。 | 百分比 |
| 集群数据 IOPS | 专用于数据读/写的 IOPS。 | 次/秒 |
| 集群 Redo 写入速率 | 集群中 redo 日志写入速率。 | 字节/秒 |
| 集群入站流量 | 流入集群的网络流量。 | 字节/秒 |
| 集群出站流量 | 从集群流出的网络流量。 | 字节/秒 |
连接与会话利用率
| 指标名称 | 描述 | 单位 |
|---|---|---|
| 总连接数 | 集群的连接总数。 | 计数 |
| 活跃连接数 | 当前活跃连接数。 | 计数 |
| 空闲连接数 | 集群中的空闲连接数。 | 计数 |
| 集群连接利用率 | 集群连接利用率百分比。 | 百分比 |
| 集群活跃会话数 | 集群节点上的活跃会话数。 | 计数 |
吞吐量与性能
| 指标名称 | 描述 | 单位 |
|---|---|---|
| 集群 TPS | 集群每秒处理的事务数。 | 次/秒 |
| 集群 QPS | 集群每秒执行的查询数。 | 次/秒 |
| TPS | 集群的事务速率。 | 次/秒 |
| 集群内存命中率 | 集群的内存命中率。 | 百分比 |
延迟
| 指标名称 | 描述 | 单位 |
|---|---|---|
| 膨胀时间 | 遇到执行延迟的查询所用的时间。 | 毫秒 |
| 执行时间超过 5 秒的 SQL | 执行时间超过 5 秒的查询数量。 | 计数 |
| 执行时间超过 3 秒的 SQL | 执行时间超过 3 秒的查询数量。 | 计数 |
| 执行时间超过 1 秒的 SQL | 执行时间超过 1 秒的查询数量。 | 计数 |
PostgreSQL 操作
| 指标名称 | 描述 | 单位 |
|---|---|---|
| PostgreSQL 活跃连接数 | 集群中的活跃连接数。 | 计数 |
| PostgreSQL 连接使用率 | 连接利用率百分比。 | 百分比 |
| PostgreSQL TPS | 每秒处理的事务数。 | 次/秒 |
| 超过 1 秒的事务数 | 耗时超过 1 秒的事务数量。 | 计数 |
| 超过 3 秒的事务数 | 耗时超过 3 秒的事务数量。 | 计数 |
| PostgreSQL 回滚率 | 已回滚事务占总事务的百分比。 | 百分比 |
| PostgreSQL PLS IOPS 读取 | PostgreSQL 执行的 I/O 读取操作次数。 | 次/秒 |
| PostgreSQL PLS IOPS 写入 | PostgreSQL 执行的 I/O 写入操作次数。 | 次/秒 |
| PostgreSQL PLS WAL 目录大小 | 集群中 WAL 文件的总大小。 | 字节 |
| PostgreSQL 块读取增量 | 查询期间从磁盘读取的块数。 | 计数 |
| PostgreSQL 内存使用量 | PostgreSQL 进程使用的总内存。 | 字节 |
| PostgreSQL 膨胀时间 | 由查询膨胀导致的总执行延迟。 | 毫秒 |
阈值配置
- 前往 Admin > Configuration Profiles > Threshold and Availability。
- 为 PolarDB PostgreSQL 版创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具有助于自动解决性能下降问题。当发生阈值突破时,告警引擎会持续检查已定义阈值的系统事件,并执行映射的自动化操作。
- 前往 Admin > IT Automation Templates。
- 创建新的自动化规则。
- 将规则映射到监视器以进行主动修复。
配置规则
借助 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动配置监控资源的设置。当新的 PolarDB PostgreSQL 版监视器被添加时,自动分配这些设置。
