帮助手册

阿里云经典型负载均衡(CLB)监控集成

Site24x7 为您的阿里云环境中的经典型负载均衡(CLB)提供开箱即用的监控支持。通过跟踪流量指标、后端服务器状态和连接统计信息,您可以实时确保高效的负载分发并检测性能问题。将您的阿里云账户与 Site24x7 集成后,所有关联的经典型负载均衡将被自动发现并纳入监控。

使用场景

  • 流量负载分布分析:监控前端和后端服务器的流量模式,识别不均衡、突发流量峰值或各可用区之间不均匀的负载分布。
  • 后端实例健康监控:当后端 ECS 实例变得不健康或无响应时接收告警,确保快速故障转移并最大程度减少宕机时间。
  • 连接饱和度检测:跟踪并发连接数以识别可能导致连接丢失或性能节流的饱和问题。
  • 延迟故障排除:分析前端和后端响应时间,检测由过载实例、DNS 解析缓慢或监听器配置错误引起的延迟问题。
  • 资源规划与扩展:利用历史流量和连接指标预测负载趋势,并就扩展后端资源做出明智决策。
  • 通过连接模式获取安全洞察:监控连接或请求的异常激增,这可能表明存在 DDoS 攻击或未经授权的访问。

设置与配置

  • 登录您的 Site24x7 账户,导航至云服务 > 阿里云 > 添加监视器
  • 编辑阿里云监视器页面中,从服务类型列表中选择经典型负载均衡
  • 添加后,转到云服务 > 阿里云 > 经典型负载均衡查看仪表板和性能指标。

支持的指标

HTTP 状态码指标

指标名称描述单位
Status Code Count (2xx) 负载均衡器收到的 HTTP 2xx 响应数量。 Count
Status Code Count (3xx) 负载均衡器收到的 HTTP 3xx 响应数量。 Count
Status Code Count (4xx) 负载均衡器收到的 HTTP 4xx 响应数量。 Count
Status Code Count (5xx) 负载均衡器收到的 HTTP 5xx 响应数量。 Count
Status Code Count (Other) 2xx–5xx 范围以外的 HTTP 响应数量。 Count
Instance Status Code Count (2xx) 后端实例发送的 2xx 响应数量。 Count
Instance Status Code Count (3xx) 后端实例发送的 3xx 响应数量。 Count
Instance Status Code Count (4xx) 后端实例发送的 4xx 响应数量。 Count
Instance Status Code Count (5xx) 后端实例发送的 5xx 响应数量。 Count
Instance Status Code Count (Other) 后端实例返回的其他 HTTP 状态码数量。 Count

上游响应指标

指标名称描述单位
Upstream Status Code Count (4xx) 上游服务器返回的 4xx 响应数量。 Count
Upstream Status Code Count (5xx) 上游服务器返回的 5xx 响应数量。 Count
Instance Upstream Status Code Count (4xx) 每个实例从上游收到的 4xx 响应数量。 Count
Instance Upstream Status Code Count (5xx) 每个实例从上游收到的 5xx 响应数量。 Count
Upstream Response Time 上游服务器的平均响应时间。 Milliseconds
Instance Upstream Response Time 每个实例上游服务器的平均响应时间。 Milliseconds

流量指标

指标名称描述单位
Group Traffic Received 服务器组收到的流量。 Bytes
Group Total Traffic Received 组中所有实例收到的总流量。 Bytes
Group Traffic Transmitted 从服务器组发送的流量。 Bytes
Group Total Traffic Transmitted 从组中所有实例发送的总流量。 Bytes
New Traffic Received 来自新连接的入站流量。 Bytes
New Traffic Transmitted 来自新连接的出站流量。 Bytes
Instance Traffic Received 实例收到的流量。 Bytes
Instance Traffic Transmitted 从实例发送的流量。 Bytes
Instance Traffic Utilization (Receive) 实例接收的允许流量容量百分比。 Percentage
Instance Traffic Utilization (Transmit) 实例发送的允许流量容量百分比。 Percentage
Instance Dropped Traffic (Receive) 实例丢弃的入站流量。 Bytes
Instance Dropped Traffic (Transmit) 实例丢弃的出站流量。 Bytes
Dropped Traffic (Receive) 因负载均衡器限制而丢弃的入站流量。 Bytes
Dropped Traffic (Transmit) 因负载均衡器限制而丢弃的出站流量。 Bytes

连接指标

指标名称描述单位
New Connection Count 建立的新连接数。 Count
Group New Connection Count 在服务器组中建立的新连接数。 Count
Instance New Connection Count 在实例上建立的新连接数。 Count
Instance New Connection Utilization 实例使用的最大新连接的百分比。 Percentage
Active Connection Count 当前活动连接数。 Count
Group Active Connection Count 服务器组中的活动连接数。 Count
Instance Active Connection Count 实例上的活动连接数。 Count
Inactive Connection Count 负载均衡器上的非活动连接数。 Count
Instance Inactive Connection Count 后端实例上的非活动连接数。 Count
Dropped Connection Count 负载均衡器丢弃的连接数。 Count
Instance Dropped Connection Count 实例上丢弃的连接数。 Count
Maximum Connection Count 负载均衡器允许的最大连接数。 Count
Instance Maximum Connection Count 实例允许的最大连接数。 Count
Instance Maximum Connection Utilization 实例使用的连接容量百分比。 Percentage

数据包指标

指标名称描述单位
Packets Received 负载均衡器收到的数据包数量。 Count
Packets Transmitted 负载均衡器发送的数据包数量。 Count
Instance Packets Received 实例收到的数据包数量。 Count
Instance Packets Transmitted 从实例发送的数据包数量。 Count
Dropped Packets (Receive) 在负载均衡器处丢弃的入站数据包数量。 Count
Dropped Packets (Transmit) 在负载均衡器处丢弃的出站数据包数量。 Count
Instance Dropped Packets (Receive) 实例丢弃的入站数据包数量。 Count
Instance Dropped Packets (Transmit) 实例丢弃的出站数据包数量。 Count

性能指标

指标名称描述单位
Queries Per Second (QPS) 负载均衡器每秒处理的查询数。 Count/second
Instance Queries Per Second (QPS) 实例每秒处理的查询数。 Count/second
Instance QPS Utilization 实例使用的最大 QPS 百分比。 Percentage
Response Time 负载均衡器记录的平均响应时间。 Milliseconds
Instance Response Time 实例记录的平均响应时间。 Milliseconds

健康指标

指标名称描述单位
Healthy Server Count 健康后端服务器的数量。 Count
Unhealthy Server Count 不健康后端服务器的数量。 Count
Healthy Server Count (With Rule) 基于健康检查规则的健康服务器数量。 Count
Unhealthy Server Count (With Rule) 基于健康检查规则的不健康服务器数量。 Count
Group Unhealthy Server Count 组中不健康服务器的数量。 Count

阈值配置

  1. 转到管理 > 配置文件 > 阈值和可用性
  2. 经典型负载均衡创建或编辑阈值配置文件。
  3. 将配置文件分配给相应监视器以触发告警。

IT 自动化

Site24x7 的 IT 自动化工具有助于自动解决性能降级问题。当发生违规时,告警引擎会持续检查已定义了阈值的系统事件,并执行映射的自动化操作。

  1. 转到管理 > IT 自动化模板
  2. 创建新的自动化规则。
  3. 将规则映射到监视器以进行主动解决。

如何为监视器配置 IT 自动化

配置规则

借助 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动完成监控资源的配置设置。在添加新的经典型负载均衡监视器时,这些设置将被自动分配。

如何添加配置规则

相关链接

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!