如何监控 DigitalOcean 中的负载均衡器
通过持续追踪连接数、请求吞吐量和错误率等指标,您可以在负载不均衡分配、后端故障或扩展问题影响用户体验之前及时发现。
有效的监控可确保顺畅的故障转移、验证性能,并支持对路由规则进行主动调优,从而在分布式环境中实现稳健、安全且响应迅速的应用程序交付。
使用场景
CPU 稳定性:通过监控 CPU 使用率和 I/O 等待时间,防止性能下降。这有助于提前发现计算、I/O 或竞争问题。
内存管理:追踪可用内存,防止崩溃,在关键进程被终止之前及早检测内存泄漏。
网络洞察:通过追踪各接口的带宽使用情况来优化吞吐量,帮助检测流量峰值和异常数据使用。
安装和配置
负载均衡器资源在 DigitalOcean 集成期间自动发现并进行监控。如需启用监控,请按以下步骤操作:
- 导航至云 > DigitalOcean > 添加 DigitalOcean 监视器。按照步骤添加 DigitalOcean 监视器。
- 在添加或编辑 DigitalOcean 监视器时,从服务/资源类型下拉列表中选择负载均衡器,然后点击保存。
- 进入云 > DigitalOcean,选择已创建的 DigitalOcean 监视器,然后点击负载均衡器。
注意
负载均衡器将在下次发现周期中根据创建 DigitalOcean 监视器时选择的频率进行发现。
数据收集频率
根据所选轮询间隔,DigitalOcean 负载均衡器的性能指标默认每两分钟收集一次,每五分钟在 Site24x7 门户中更新一次。
支持的指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Frontend Connections Current(前端当前连接数) | 负载均衡器前端当前处于活跃状态的连接数。 | 计数 |
| Frontend Connections Limit(前端连接数限制) | 负载均衡器前端允许的最大同时连接数。 | 计数 |
| Frontend TLS Connections Current(前端当前 TLS 连接数) | 前端当前已建立的活跃 TLS 加密连接数。 | 计数 |
| Frontend TLS Connections Limit(前端 TLS 连接数限制) | 前端允许的最大并发 TLS 连接数。 | 计数 |
| Frontend TLS Connections Exceeding Rate Limit(超出速率限制的前端 TLS 连接数) | 因超出配置的速率限制而被限流的 TLS 连接数。 | 计数 |
| Frontend CPU Utilization(前端 CPU 使用率) | 负载均衡器前端进程消耗的 CPU 百分比。 | 百分比 |
| Frontend HTTP Requests Per Second(前端每秒 HTTP 请求数) | 前端每秒接收和处理的 HTTP 请求速率。 | 次/秒 |
| Frontend HTTP Responses(前端 HTTP 响应数) | 从前端发送给客户端的 HTTP 响应总数。 | 计数 |
| Frontend Network Throughput HTTP(前端 HTTP 网络吞吐量) | 每秒流经负载均衡器前端的 HTTP 流量。 | 位/秒 |
| Frontend Network Throughput TCP(前端 TCP 网络吞吐量) | 每秒流经负载均衡器前端的 TCP 流量。 | 位/秒 |
| Frontend Network Throughput UDP(前端 UDP 网络吞吐量) | 每秒流经负载均衡器前端的 UDP 流量。 | 位/秒 |
| Frontend NLB TCP Network Throughput(前端 NLB TCP 网络吞吐量) | 网络负载均衡器(NLB)前端的 TCP 网络吞吐量。 | 位/秒 |
| Frontend NLB UDP Network Throughput(前端 NLB UDP 网络吞吐量) | 网络负载均衡器(NLB)前端的 UDP 网络吞吐量。 | 位/秒 |
| Frontend Firewall Dropped Packets(前端防火墙丢弃的数据包) | 被负载均衡器集成防火墙规则丢弃的数据包数。 | 计数 |
| Frontend Firewall Dropped Bytes(前端防火墙丢弃的字节数) | 被负载均衡器集成防火墙规则丢弃的数据量。 | 字节 |
| Droplets Connections(Droplet 连接数) | 负载均衡器与后端 Droplet 之间当前处于活跃状态的连接数。 | 计数 |
| Droplets Health Checks(Droplet 健康检查次数) | 监控间隔内对后端 Droplet 执行的健康检查次数。 | 计数 |
| Droplets HTTP Responses(Droplet HTTP 响应数) | 负载均衡器从后端 Droplet 收到的 HTTP 响应总数。 | 计数 |
| Droplets HTTP Response Time Avg(Droplet 平均 HTTP 响应时间) | 后端 Droplet 响应 HTTP 请求的平均时间。 | 秒 |
| Droplets HTTP Session Duration Avg(Droplet 平均 HTTP 会话时长) | 负载均衡器与后端 Droplet 之间 HTTP 会话的平均持续时间。 | 秒 |
| Droplets Queue Size(Droplet 队列大小) | 当前正在排队等待可用后端 Droplet 连接的请求数。 | 计数 |
阈值配置
您可以为所有负载均衡器指标配置阈值和告警,以主动检测性能下降或连接问题。
- 进入管理 > 配置文件 > 阈值和可用性。
- 为负载均衡器创建或编辑阈值配置文件。
- 将配置文件分配给相应监视器以触发告警。
IT 自动化
使用 Site24x7 的 IT 自动化功能自动解决负载均衡器常见性能问题:
- 进入管理 > IT 自动化模板,然后点击添加自动化模板。
- 通过选择自动化类型(例如服务器重启、清空队列)创建自动化规则。
- 将创建的规则映射到负载均衡器,以便在告警时自动执行。
配置规则
使用配置规则简化跨负载均衡器实例的批量设置。在发现新监视器时,自动分配阈值配置文件、通知配置文件、标签和监视器组。
