阿里云 Tair 监控集成
Site24x7 提供对阿里云 Tair 的内置监控,助您实时掌握数据库健康状况和性能表现。通过对命令数、命中率、内存用量、连接配额和网络流量的深入洞察,您可以主动识别瓶颈、优化资源,并维持服务稳定性。将阿里云账号与 Site24x7 集成后,所有 Tair 实例将自动被发现并持续受到监控。
使用场景
- 命令追踪:监控已处理的命令数、命中数和未命中数,了解工作负载效率。
- 内存管理:在读写分离和分片模式下追踪 Lua 内存用量,以优化容量规划。
- 连接控制:实时掌握连接配额和使用情况,避免资源耗尽。
- 延迟监控:分析平均响应时间和请求大小,确保性能一致性。
- 网络健康:衡量入站和出站流量比例,保证流量均衡和稳定运行。
设置与配置
- 登录您的 Site24x7 账号,导航至云监控 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面中,从服务类型列表中选择 Tair。
- 添加完成后,前往云监控 > 阿里云 > Tair,查看仪表板和性能指标。
支持的指标
命令、键空间与命中率
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Sharding GET QPS | 分片模式下每秒处理的 GET 查询数。 | Count/second |
| Sharding Used QPS | 分片模式下每秒处理的查询总数。 | Count/second |
| Sharding Expired Keys per Second | 分片模式下每秒过期的键数量。 | Count/second |
| SplitRW Other Operations | 读写分离模式下执行的其他操作数。 | Count |
| SplitRW Expires | 读写分离模式下过期的键数量。 | Count |
| SplitRW Evicted Keys per Second | 读写分离模式下每秒被驱逐的键数量。 | Count/second |
| Standard Total Commands Processed | 标准节点处理的命令总数。 | Count |
| Standard Other Operations | 标准模式下执行的其他操作数。 | Count |
| Standard Expires | 标准模式下过期的键数量。 | Count |
| Standard Evicted Keys per Second | 标准模式下每秒被驱逐的键数量。 | Count/second |
| Standard Hit Rate | 标准模式下的缓存命中率。 | Percentage |
| Sharding Hit Rate | 分片模式下的缓存命中率。 | Percentage |
| Standard Misses | 标准模式下的缓存未命中数。 | Count |
| Sharding Misses | 分片模式下的缓存未命中数。 | Count |
内存用量
| 指标名称 | 描述 | 单位 |
|---|---|---|
| SplitRW Used Memory (Lua) | 读写分离模式下 Lua 脚本使用的内存总量。 | Bytes |
| Sharding Used Memory (Lua) | 分片模式下 Lua 脚本使用的内存总量。 | Bytes |
连接数与配额
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Connection Usage | 已使用连接数的占比。 | Percentage |
| SplitRW Quota Connection | 读写分离模式下可用的连接配额。 | Count |
| SplitRW Node Used Connection | 读写分离模式下某节点当前使用的连接数。 | Count |
| SplitRW Node Connection Usage | 读写分离模式下某节点已使用连接数的占比。 | Percentage |
| Sharding Proxy Connection Usage | 分片代理已使用连接数的占比。 | Percentage |
性能与延迟
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Standard Average Response Time | 标准模式下请求的平均响应时间。 | Milliseconds |
| Sharding Proxy Average Request Size | 分片代理的平均请求大小。 | Bytes |
| SplitRW Proxy Average Response Size | 读写分离代理的平均响应大小。 | Bytes |
| SplitRW Proxy Maximum Request Size | 读写分离代理记录的最大请求大小。 | Bytes |
| SplitRW Proxy Maximum Response Size | 读写分离代理记录的最大响应大小。 | Bytes |
网络流量
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Intranet Inbound Ratio | 内网入站流量占比。 | Percentage |
| Intranet Outbound Ratio | 内网出站流量占比。 | Percentage |
| SplitRW Node Proxy Intranet Inbound | 读写分离节点代理处理的内网入站流量。 | Bytes |
| SplitRW Proxy Intranet Outbound | 读写分离代理处理的内网出站流量。 | Bytes |
| SplitRW Node Intranet Inbound Ratio | 读写分离节点的内网入站流量比率。 | Percentage |
阈值配置
- 前往管理 > 配置文件 > 阈值与可用性。
- 为 Tair 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。当发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行关联的自动化操作。
- 前往管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则关联到监视器,以实现主动解决问题。
配置规则
通过 Site24x7 的配置规则,您可以为多个监视器统一设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化管理监控资源的配置。在添加新的 Tair 监视器时,系统将自动应用这些配置。
