阿里云 PolarDB MySQL 版监控集成
Site24x7 为阿里云 PolarDB MySQL 版提供端到端监控,可深入了解计算资源、内存利用率、查询吞吐量和会话活动等情况。将阿里云账户与 Site24x7 集成后,所有 PolarDB MySQL 版实例将自动发现并纳入监控。
使用场景
- 资源优化:跟踪集群节点的 CPU、内存和 I/O 使用情况,防止资源过度占用。
- 性能监控:测量 QPS、TPS、慢查询和长事务,优化工作负载性能。
- 连接管理:监控活跃连接、空闲连接和总连接数,防止会话饱和。
- 复制延迟分析:检测副本延迟和锁争用,保证数据一致性。
- 自动化告警:配置阈值和 IT 自动化,主动应对异常情况。
设置与配置
- 登录您的 Site24x7 账户,导航至云 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面,从服务类型列表中选择 PolarDB MySQL 版。
- 添加完成后,前往云 > 阿里云 > PolarDB MySQL 版查看仪表板和性能指标。
支持的指标
计算与内存
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Cluster CPU Utilization | 集群 CPU 利用率百分比。 | 百分比 |
| Cluster Memory Utilization | 集群内存使用率百分比。 | 百分比 |
| Total CPU Usage | 集群 CPU 总使用率。 | 百分比 |
| Memory Usage | 集群内存总使用率。 | 百分比 |
| Cluster PCU by CPU Cores | 集群中每个 CPU 核心的使用率。 | 百分比 |
| Cluster Proxy CPU Utilization | 集群代理层的 CPU 利用率。 | 百分比 |
磁盘与 I/O
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Cluster IOPS | 集群每秒 I/O 操作总数。 | 次/秒 |
| Cluster IOPS Usage | IOPS 利用率百分比。 | 百分比 |
| Cluster Disk Utilization | 集群节点磁盘空间利用率。 | 百分比 |
| Cluster Data IOPS | 专用于数据读写的 IOPS。 | 次/秒 |
| Cluster Redo Write Rate | 集群中 redo 日志的写入速率。 | 字节/秒 |
| Cluster Input Traffic | 集群入站网络流量。 | 字节/秒 |
| Cluster Output Traffic | 集群出站网络流量。 | 字节/秒 |
连接数
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Total Connections | 集群连接总数。 | 个 |
| Active Connections | 当前活跃连接数。 | 个 |
| Idle Connections | 集群中空闲连接数。 | 个 |
| Cluster Connection Utilization | 集群连接利用率百分比。 | 百分比 |
| Cluster Active Sessions | 集群节点上的活跃会话数。 | 个 |
吞吐量与性能
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Cluster TPS | 集群每秒处理的事务数。 | 次/秒 |
| Cluster QPS | 集群每秒执行的查询数。 | 次/秒 |
| TPS | 集群事务处理速率。 | 次/秒 |
| Cluster Memory Hit Ratio | 集群内存命中率。 | 百分比 |
延迟
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Swell Time | 查询执行延迟所花费的时间。 | 毫秒 |
| SQLs Executing > 5s | 执行时间超过 5 秒的查询数。 | 个 |
| SQLs Executing > 3s | 执行时间超过 3 秒的查询数。 | 个 |
| SQLs Executing > 1s | 执行时间超过 1 秒的查询数。 | 个 |
MySQL 操作
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Cluster COM SELECT | 集群中执行的 SELECT 语句数。 | 次 |
| Cluster COM INSERT | 执行的 INSERT 语句数。 | 次 |
| Cluster COM INSERT SELECT | 执行的 INSERT INTO ... SELECT 语句数。 | 次 |
| Cluster COM UPDATE | 执行的 UPDATE 语句数。 | 次 |
| Cluster COM UPDATE MULTI | 执行的多行 UPDATE 语句数。 | 次 |
| Cluster COM DELETE | 执行的 DELETE 语句数。 | 次 |
| Cluster COM DELETE MULTI | 执行的多行 DELETE 语句数。 | 次 |
| Cluster COM REPLACE | 执行的 REPLACE 语句数。 | 次 |
| Cluster COM REPLACE SELECT | 执行的 REPLACE INTO ... SELECT 语句数。 | 次 |
| Cluster Slow Queries/sec | 集群每秒慢查询数。 | 次/秒 |
| Cluster InnoDB Buffer Read Hit Rate | 从 InnoDB 缓冲区缓存中命中读取的百分比。 | 百分比 |
| Cluster InnoDB Buffer Dirty Ratio | InnoDB 缓冲池中脏页的百分比。 | 百分比 |
| Transactions > 5s | 执行时间超过 5 秒的事务数。 | 个 |
| Rollback Ratio | 回滚事务占总事务的比率。 | 百分比 |
| Cluster Replica Lag | 主节点与副本节点之间的复制延迟。 | 毫秒 |
| Cluster MDL Lock Sessions | 等待元数据锁的会话数。 | 个 |
| Cluster Other Lock Sessions | 被其他锁阻塞的会话数。 | 个 |
阈值配置
- 前往管理 > 配置文件 > 阈值与可用性。
- 为 PolarDB MySQL 版创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。当发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行映射的自动化操作。
- 前往管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射到监视器,以实现主动解决。
配置规则
通过 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。当新的 PolarDB MySQL 版监视器添加时,可自动应用这些设置。
