阿里云经典型负载均衡(CLB)监控集成
Site24x7 为您的阿里云环境中的经典型负载均衡(CLB)提供开箱即用的监控支持。通过跟踪流量指标、后端服务器状态和连接统计信息,您可以实时确保高效的负载分发并检测性能问题。将您的阿里云账户与 Site24x7 集成后,所有关联的经典型负载均衡将被自动发现并纳入监控。
使用场景
- 流量负载分布分析:监控前端和后端服务器的流量模式,识别不均衡、突发流量峰值或各可用区之间不均匀的负载分布。
- 后端实例健康监控:当后端 ECS 实例变得不健康或无响应时接收告警,确保快速故障转移并最大程度减少宕机时间。
- 连接饱和度检测:跟踪并发连接数以识别可能导致连接丢失或性能节流的饱和问题。
- 延迟故障排除:分析前端和后端响应时间,检测由过载实例、DNS 解析缓慢或监听器配置错误引起的延迟问题。
- 资源规划与扩展:利用历史流量和连接指标预测负载趋势,并就扩展后端资源做出明智决策。
- 通过连接模式获取安全洞察:监控连接或请求的异常激增,这可能表明存在 DDoS 攻击或未经授权的访问。
设置与配置
- 登录您的 Site24x7 账户,导航至云服务 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面中,从服务类型列表中选择经典型负载均衡。
- 添加后,转到云服务 > 阿里云 > 经典型负载均衡查看仪表板和性能指标。
支持的指标
HTTP 状态码指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Status Code Count (2xx) | 负载均衡器收到的 HTTP 2xx 响应数量。 | Count |
| Status Code Count (3xx) | 负载均衡器收到的 HTTP 3xx 响应数量。 | Count |
| Status Code Count (4xx) | 负载均衡器收到的 HTTP 4xx 响应数量。 | Count |
| Status Code Count (5xx) | 负载均衡器收到的 HTTP 5xx 响应数量。 | Count |
| Status Code Count (Other) | 2xx–5xx 范围以外的 HTTP 响应数量。 | Count |
| Instance Status Code Count (2xx) | 后端实例发送的 2xx 响应数量。 | Count |
| Instance Status Code Count (3xx) | 后端实例发送的 3xx 响应数量。 | Count |
| Instance Status Code Count (4xx) | 后端实例发送的 4xx 响应数量。 | Count |
| Instance Status Code Count (5xx) | 后端实例发送的 5xx 响应数量。 | Count |
| Instance Status Code Count (Other) | 后端实例返回的其他 HTTP 状态码数量。 | Count |
上游响应指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Upstream Status Code Count (4xx) | 上游服务器返回的 4xx 响应数量。 | Count |
| Upstream Status Code Count (5xx) | 上游服务器返回的 5xx 响应数量。 | Count |
| Instance Upstream Status Code Count (4xx) | 每个实例从上游收到的 4xx 响应数量。 | Count |
| Instance Upstream Status Code Count (5xx) | 每个实例从上游收到的 5xx 响应数量。 | Count |
| Upstream Response Time | 上游服务器的平均响应时间。 | Milliseconds |
| Instance Upstream Response Time | 每个实例上游服务器的平均响应时间。 | Milliseconds |
流量指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Group Traffic Received | 服务器组收到的流量。 | Bytes |
| Group Total Traffic Received | 组中所有实例收到的总流量。 | Bytes |
| Group Traffic Transmitted | 从服务器组发送的流量。 | Bytes |
| Group Total Traffic Transmitted | 从组中所有实例发送的总流量。 | Bytes |
| New Traffic Received | 来自新连接的入站流量。 | Bytes |
| New Traffic Transmitted | 来自新连接的出站流量。 | Bytes |
| Instance Traffic Received | 实例收到的流量。 | Bytes |
| Instance Traffic Transmitted | 从实例发送的流量。 | Bytes |
| Instance Traffic Utilization (Receive) | 实例接收的允许流量容量百分比。 | Percentage |
| Instance Traffic Utilization (Transmit) | 实例发送的允许流量容量百分比。 | Percentage |
| Instance Dropped Traffic (Receive) | 实例丢弃的入站流量。 | Bytes |
| Instance Dropped Traffic (Transmit) | 实例丢弃的出站流量。 | Bytes |
| Dropped Traffic (Receive) | 因负载均衡器限制而丢弃的入站流量。 | Bytes |
| Dropped Traffic (Transmit) | 因负载均衡器限制而丢弃的出站流量。 | Bytes |
连接指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| New Connection Count | 建立的新连接数。 | Count |
| Group New Connection Count | 在服务器组中建立的新连接数。 | Count |
| Instance New Connection Count | 在实例上建立的新连接数。 | Count |
| Instance New Connection Utilization | 实例使用的最大新连接的百分比。 | Percentage |
| Active Connection Count | 当前活动连接数。 | Count |
| Group Active Connection Count | 服务器组中的活动连接数。 | Count |
| Instance Active Connection Count | 实例上的活动连接数。 | Count |
| Inactive Connection Count | 负载均衡器上的非活动连接数。 | Count |
| Instance Inactive Connection Count | 后端实例上的非活动连接数。 | Count |
| Dropped Connection Count | 负载均衡器丢弃的连接数。 | Count |
| Instance Dropped Connection Count | 实例上丢弃的连接数。 | Count |
| Maximum Connection Count | 负载均衡器允许的最大连接数。 | Count |
| Instance Maximum Connection Count | 实例允许的最大连接数。 | Count |
| Instance Maximum Connection Utilization | 实例使用的连接容量百分比。 | Percentage |
数据包指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Packets Received | 负载均衡器收到的数据包数量。 | Count |
| Packets Transmitted | 负载均衡器发送的数据包数量。 | Count |
| Instance Packets Received | 实例收到的数据包数量。 | Count |
| Instance Packets Transmitted | 从实例发送的数据包数量。 | Count |
| Dropped Packets (Receive) | 在负载均衡器处丢弃的入站数据包数量。 | Count |
| Dropped Packets (Transmit) | 在负载均衡器处丢弃的出站数据包数量。 | Count |
| Instance Dropped Packets (Receive) | 实例丢弃的入站数据包数量。 | Count |
| Instance Dropped Packets (Transmit) | 实例丢弃的出站数据包数量。 | Count |
性能指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Queries Per Second (QPS) | 负载均衡器每秒处理的查询数。 | Count/second |
| Instance Queries Per Second (QPS) | 实例每秒处理的查询数。 | Count/second |
| Instance QPS Utilization | 实例使用的最大 QPS 百分比。 | Percentage |
| Response Time | 负载均衡器记录的平均响应时间。 | Milliseconds |
| Instance Response Time | 实例记录的平均响应时间。 | Milliseconds |
健康指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Healthy Server Count | 健康后端服务器的数量。 | Count |
| Unhealthy Server Count | 不健康后端服务器的数量。 | Count |
| Healthy Server Count (With Rule) | 基于健康检查规则的健康服务器数量。 | Count |
| Unhealthy Server Count (With Rule) | 基于健康检查规则的不健康服务器数量。 | Count |
| Group Unhealthy Server Count | 组中不健康服务器的数量。 | Count |
阈值配置
- 转到管理 > 配置文件 > 阈值和可用性。
- 为经典型负载均衡创建或编辑阈值配置文件。
- 将配置文件分配给相应监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具有助于自动解决性能降级问题。当发生违规时,告警引擎会持续检查已定义了阈值的系统事件,并执行映射的自动化操作。
- 转到管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射到监视器以进行主动解决。
配置规则
借助 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动完成监控资源的配置设置。在添加新的经典型负载均衡监视器时,这些设置将被自动分配。
