阿里云 AnalyticDB for PostgreSQL 监控集成
Site24x7 为阿里云环境中部署的 AnalyticDB for PostgreSQL(ADB for PostgreSQL)实例提供开箱即用的监控功能。通过对 CPU、内存、磁盘使用率、查询性能和复制健康状况的深度洞察,您可以确保复杂分析工作负载的平稳运行。将阿里云账户与 Site24x7 集成后,所有关联的 ADB for PostgreSQL 实例将被自动发现并持续监控。
使用场景
- 容量监控:跟踪磁盘、IOPS 和内存使用情况,避免性能瓶颈。
- 查询优化:监控阻塞和排队中的查询,识别工作负载延迟。
- 复制可见性:测量同步延迟,维护数据一致性。
- 连接管理:深入了解活跃连接、空闲连接及分片级别的连接情况。
- 健康跟踪:监控主节点和分片节点的不健康数量,及时发现故障。
- 运营洞察:跟踪 ACU 使用率和物化视图更新延迟,支持实时分析。
设置与配置
- 登录您的 Site24x7 账户,前往 Cloud > Alibaba Cloud > Add Monitor。
- 在编辑阿里云监视器页面,从服务类型列表中选择 AnalyticDB for PostgreSQL。
- 添加完成后,前往 Cloud > Alibaba > AnalyticDB for PostgreSQL 查看仪表板和性能指标。
支持的指标
容量与利用率
| 指标名称 | 说明 | 单位 |
|---|---|---|
| Disk Usage | 实例的整体磁盘利用率。 | Percentage |
| ADBPG Instance Disk Used MB | 实例已使用的磁盘总空间。 | Bytes |
| ADBPG Instance Disk Usage Percent | 实例磁盘使用百分比。 | Percentage |
| Node Disk Used Percent | 节点级别的磁盘使用百分比。 | Percentage |
| Node Segment Workfile Used MB | 分片工作文件使用的磁盘空间量。 | Bytes |
| Memory Usage | 实例的整体内存利用率。 | Percentage |
| Node Memory Used Percent | 节点级别的内存使用百分比。 | Percentage |
CPU 与 IOPS
| 指标名称 | 说明 | 单位 |
|---|---|---|
| CPU Usage | 实例的整体 CPU 利用率。 | Percentage |
| Node CPU Used Percent | 节点级别的 CPU 使用百分比。 | Percentage |
| IOPS Usage | 实例的整体 IOPS 利用率。 | Percentage |
| Node Disk IOPS | 节点级别每秒的 I/O 操作数。 | Count |
| Node Disk IOPS Percent | 节点级别的 IOPS 使用百分比。 | Percentage |
连接与工作负载
| 指标名称 | 说明 | 单位 |
|---|---|---|
| ADBPG Connection Count | 到实例的连接总数。 | Count |
| ADBPG Connection Idle | 实例中的空闲连接数。 | Count |
| ADBPG Master Connection Percent | 主节点所使用的连接百分比。 | Percentage |
| Connection Usage | 连接利用率百分比。 | Percentage |
| Node Segment Connection Count | 到分片节点的活跃连接数。 | Count |
健康状况与专项指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| ADBPG Master Count Unhealthy | 不健康的主节点数量。 | Count |
| ADBPG Segment Count Unhealthy | 不健康的分片节点数量。 | Count |
| ADBPG ACU Daily Usage | 每日 AnalyticDB 计算单元 (ACU) 使用量。 | Count |
| ADBPG ACU Used | 当前已使用的 ACU 总数。 | Count |
| ADBPG Realtime MV Max Update Latency | 实时物化视图的最大更新延迟。 | Milliseconds |
| ADBPG Realtime MV Update Failed Count | 物化视图更新失败次数。 | Count |
阈值配置
- 前往管理 > 配置文件 > 阈值和可用性。
- 为 AnalyticDB for PostgreSQL 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。当发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行相应的自动化操作。
- 前往管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射到监视器,以实现主动解决问题。
配置规则
通过 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。在添加新的 AnalyticDB for PostgreSQL 监视器时,这些设置将自动应用。
