阿里云 AnalyticsDB for MySQL 监控集成
Site24x7 为部署在阿里云中的 AnalyticsDB for MySQL 提供全面监控,帮助您跟踪资源使用情况、识别查询瓶颈并了解实时分析工作负载的模式。将阿里云账户与 Site24x7 集成后,所有关联的 AnalyticsDB for MySQL 实例将被自动发现并开始监控。
使用场景
- 查询延迟洞察:监控平均和最大响应时间,定位慢查询或过载查询。
- 资源跟踪:获取工作节点和执行节点的 CPU、I/O 和磁盘使用情况可见性,防止资源争用。
- 写入性能调优:监控数据摄取速率和写入延迟,提升写入效率。
- 工作负载优化:分析重提交查询和短查询,改善工作负载管理。
- 故障监控:提前检测查询失败趋势,确保应用程序可靠性。
设置与配置
- 登录您的 Site24x7 账户,导航至云 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面中,从服务类型列表中选择 AnalyticsDB for MySQL。
- 添加完成后,前往云 > 阿里云 > AnalyticsDB for MySQL,查看仪表板和性能指标。
支持的指标
执行节点和工作节点的 CPU / IO
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Executor Average CPU Used | 执行节点的平均 CPU 使用率。 | 百分比 |
| Executor Maximum CPU Used | 执行节点观测到的峰值 CPU 使用率。 | 百分比 |
| Worker Average CPU Used | 工作节点的平均 CPU 使用率。 | 百分比 |
| Worker Maximum CPU Used | 工作节点的峰值 CPU 使用率。 | 百分比 |
| Worker Average I/O Utilization | 工作节点的平均 I/O 利用率。 | 百分比 |
| Executor Average Write IOPS | 执行节点每秒平均写入操作次数。 | IOPS |
| Executor Average Read IOPS | 执行节点每秒平均读取操作次数。 | IOPS |
| Worker Average Write IOPS | 工作节点每秒平均写入操作次数。 | IOPS |
| Worker Average Read IOPS | 工作节点每秒平均读取操作次数。 | IOPS |
磁盘和存储使用情况
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Disk Used (MB) | 已使用的总磁盘空间。 | MB |
| Disk Used Percentage | 磁盘使用率百分比。 | 百分比 |
| Cold Data Disk Usage | 冷数据存储使用的磁盘空间。 | MB |
| Hot Data Disk Usage | 热数据存储使用的磁盘空间。 | MB |
| Worker Maximum Node Disk Used | 所有工作节点的最大磁盘使用率百分比。 | 百分比 |
查询性能与延迟
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Query Average Response Time | 查询的平均响应时间。 | 毫秒 |
| Query Maximum Response Time | 查询中观测到的最大响应时间。 | 毫秒 |
| Query Total Wait Time | 所有查询的总等待时间。 | 毫秒 |
| Query Failed Ratio | 失败查询占总查询数的比率。 | 百分比 |
| Queries Per Second (QPS) | 每秒处理的查询数量。 | 次/秒 |
| Transactions Per Second (TPS) | 每秒处理的事务数量。 | 次/秒 |
| APS Average Latency | APS 查询的平均延迟。 | 毫秒 |
| APS Maximum Latency | APS 查询的最大延迟。 | 毫秒 |
| APS Average Latency by Job | 按作业分组的 APS 查询平均延迟。 | 毫秒 |
| APS Maximum Latency by Job | 按作业分组的 APS 查询最大延迟。 | 毫秒 |
写入性能
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Insert Incoming Bytes | 写入数据库的数据量。 | 字节 |
| Insert Maximum Response Time | 写入操作的最大耗时。 | 毫秒 |
| Insert Average Response Time | 写入操作的平均耗时。 | 毫秒 |
WLM(工作负载管理)与故障
| 指标名称 | 描述 | 单位 |
|---|---|---|
| WLM SQA Queries Count | 短查询加速(SQA)执行的查询数量。 | 次 |
| WLM Resubmitted Queries Count | 失败后重新提交的查询数量。 | 次 |
阈值配置
- 前往管理 > 配置文件 > 阈值与可用性。
- 为 AnalyticsDB for MySQL 创建或编辑阈值配置文件。
- 将配置文件分配给相应监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具有助于自动解决性能下降问题。当发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行映射的自动化操作。
- 前往管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射到监视器以实现主动解决。
配置规则
利用 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。在新增 AnalyticsDB for MySQL 监视器时,可自动应用这些设置。
