帮助手册

阿里云 Tair 监控集成

Site24x7 提供对阿里云 Tair 的内置监控,助您实时掌握数据库健康状况和性能表现。通过对命令数、命中率、内存用量、连接配额和网络流量的深入洞察,您可以主动识别瓶颈、优化资源,并维持服务稳定性。将阿里云账号与 Site24x7 集成后,所有 Tair 实例将自动被发现并持续受到监控。

使用场景

  • 命令追踪:监控已处理的命令数、命中数和未命中数,了解工作负载效率。
  • 内存管理:在读写分离和分片模式下追踪 Lua 内存用量,以优化容量规划。
  • 连接控制:实时掌握连接配额和使用情况,避免资源耗尽。
  • 延迟监控:分析平均响应时间和请求大小,确保性能一致性。
  • 网络健康:衡量入站和出站流量比例,保证流量均衡和稳定运行。

设置与配置

  • 登录您的 Site24x7 账号,导航至云监控 > 阿里云 > 添加监视器
  • 编辑阿里云监视器页面中,从服务类型列表中选择 Tair
  • 添加完成后,前往云监控 > 阿里云 > Tair,查看仪表板和性能指标。

支持的指标

命令、键空间与命中率

指标名称描述单位
Sharding GET QPS 分片模式下每秒处理的 GET 查询数。 Count/second
Sharding Used QPS 分片模式下每秒处理的查询总数。 Count/second
Sharding Expired Keys per Second 分片模式下每秒过期的键数量。 Count/second
SplitRW Other Operations 读写分离模式下执行的其他操作数。 Count
SplitRW Expires 读写分离模式下过期的键数量。 Count
SplitRW Evicted Keys per Second 读写分离模式下每秒被驱逐的键数量。 Count/second
Standard Total Commands Processed 标准节点处理的命令总数。 Count
Standard Other Operations 标准模式下执行的其他操作数。 Count
Standard Expires 标准模式下过期的键数量。 Count
Standard Evicted Keys per Second 标准模式下每秒被驱逐的键数量。 Count/second
Standard Hit Rate 标准模式下的缓存命中率。 Percentage
Sharding Hit Rate 分片模式下的缓存命中率。 Percentage
Standard Misses 标准模式下的缓存未命中数。 Count
Sharding Misses 分片模式下的缓存未命中数。 Count

内存用量

指标名称描述单位
SplitRW Used Memory (Lua) 读写分离模式下 Lua 脚本使用的内存总量。 Bytes
Sharding Used Memory (Lua) 分片模式下 Lua 脚本使用的内存总量。 Bytes

连接数与配额

指标名称描述单位
Connection Usage 已使用连接数的占比。 Percentage
SplitRW Quota Connection 读写分离模式下可用的连接配额。 Count
SplitRW Node Used Connection 读写分离模式下某节点当前使用的连接数。 Count
SplitRW Node Connection Usage 读写分离模式下某节点已使用连接数的占比。 Percentage
Sharding Proxy Connection Usage 分片代理已使用连接数的占比。 Percentage

性能与延迟

指标名称描述单位
Standard Average Response Time 标准模式下请求的平均响应时间。 Milliseconds
Sharding Proxy Average Request Size 分片代理的平均请求大小。 Bytes
SplitRW Proxy Average Response Size 读写分离代理的平均响应大小。 Bytes
SplitRW Proxy Maximum Request Size 读写分离代理记录的最大请求大小。 Bytes
SplitRW Proxy Maximum Response Size 读写分离代理记录的最大响应大小。 Bytes

网络流量

指标名称描述单位
Intranet Inbound Ratio 内网入站流量占比。 Percentage
Intranet Outbound Ratio 内网出站流量占比。 Percentage
SplitRW Node Proxy Intranet Inbound 读写分离节点代理处理的内网入站流量。 Bytes
SplitRW Proxy Intranet Outbound 读写分离代理处理的内网出站流量。 Bytes
SplitRW Node Intranet Inbound Ratio 读写分离节点的内网入站流量比率。 Percentage

阈值配置

  1. 前往管理 > 配置文件 > 阈值与可用性
  2. Tair 创建或编辑阈值配置文件。
  3. 将配置文件分配给相应的监视器以触发告警。

IT 自动化

Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。当发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行关联的自动化操作。

  1. 前往管理 > IT 自动化模板
  2. 创建新的自动化规则。
  3. 将规则关联到监视器,以实现主动解决问题。

如何为监视器配置 IT 自动化

配置规则

通过 Site24x7 的配置规则,您可以为多个监视器统一设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化管理监控资源的配置。在添加新的 Tair 监视器时,系统将自动应用这些配置。

如何添加配置规则

相关链接

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!