帮助手册

网络负载均衡器监控

OCI 网络负载均衡器是一项快速、可扩展的服务,利用网络层信息将入站流量分配到多台后端服务器,非常适合数据库应用等低延迟、长时运行的任务。Site24x7 通过实时监控后端健康状态、连接性能和监听器可用性,确保流量仅路由到健康资源,从而增强该服务的可靠性。

概述

Site24x7 与 Oracle Cloud Infrastructure (OCI) 网络负载均衡器的集成,实现了对您的高性能、低延迟负载均衡资源的端到端可见性和健康跟踪。

此集成帮助您监控网络负载均衡器及其关联组件的健康状态、流量分配和资源使用情况,以确保可靠的应用交付和最低延迟。此集成还提供以下子监视器:

  • 后端集:OCI 网络负载均衡器的关键组件,用于定义入站流量如何分配到后端服务器。使用 Site24x7 监控后端集,可确保流量仅路由到健康的后端服务器,从而维护服务可用性并快速检测和解决性能问题。
  • 监听器:客户端流量进入网络负载均衡器的入口,配置为监听特定端口和协议。Site24x7 监控每个监听器,追踪入站流量、活跃连接数和端口级配置详情等指标,确保应用流量无缝流入、及早发现配置错误,并维持最佳负载均衡器性能。

使用场景

一家全球电商公司在 OCI 上托管其面向客户的应用,并依赖 OCI 网络负载均衡器管理跨多个可用域部署的后端服务器的大量 TCP 流量。为确保在购物高峰期服务不中断,该公司将其 OCI 网络负载均衡器与 Site24x7 集成。

借助 Site24x7 提供的实时健康检查、连接指标和流量可见性,IT 运营团队可以主动检测后端服务器故障和异常流量模式。在一次季节性特卖活动期间,Site24x7 告警帮助团队快速识别并隔离了一个配置错误的后端集,最大限度地减少了宕机时间,并确保了客户的无缝购物体验。此集成显著增强了公司维持高可用性、加快故障排除以及充满信心地扩展运营的能力。

Site24x7 负载均衡器集成的优势

将您的网络负载均衡器与 Site24x7 集成,充分利用以下优势:

  • 持续监控后端服务器的健康状态,确保跨实例的可靠流量分配。
  • 追踪延迟、丢弃的连接和后端服务器响应时间,以精细调整负载均衡策略。
  • 在保留原始客户端 IP 的同时监控流量,以便更好地进行溯源和诊断。
  • 在性能问题或健康检查故障影响用户之前收到通知,从而快速进行补救。
  • 深入了解连接模式和后端状态,加快根因分析。

设置与配置

  • Site24x7 使用跨租户访问,通过 Site24x7 的租户用户监控您的资源。登录您的 Site24x7 账户,创建特定策略,允许 Site24x7 查看您的资源而不影响安全性。
  • 集成 OCI 监视器页面,从要发现的服务列表中选择负载均衡器

策略与权限

请确保关联的 OCI 策略包含以下声明:

  • read the network-load-balancer-family

轮询频率

Site24x7 根据设定的轮询频率(从每分钟一次到每天一次)查询 OCI 服务级 API,以从网络负载均衡器监视器收集指标。

支持的指标

网络负载均衡器

以下是网络负载均衡器监视器支持的指标:

指标名称 描述 统计方式 单位

处理字节数

网络负载均衡器处理的总字节数,包括 TCP/IP 标头。

Sum

字节

处理数据包数

网络负载均衡器处理的总数据包数。

Sum

Count

被安全列表丢弃的入站数据包数

从网络接收的、以网络负载均衡器为目标的数据包中,因违反安全规则而被丢弃的数量。

Sum

Count

被安全列表丢弃的出站数据包数

网络负载均衡器发送的、以网络为目标的数据包中,因违反安全规则而被丢弃的数量。

Sum

Count

新建连接数

客户端与后端服务器之间新建连接的总数。

Maximum

Count

新建 TCP 连接数

客户端与后端服务器之间新建 TCP 连接的总数。

Maximum

Count

新建 UDP 连接数

客户端与后端服务器之间新建 UDP 连接的总数。

Maximum

Count

网络负载均衡器接收的 VTAP 数据包数

网络负载均衡器接收的 VTAP 数据包数量。

Sum

Count

网络负载均衡器接收的 VTAP 字节数

网络负载均衡器接收的 VTAP 字节数量。

Sum

字节

网络负载均衡器发送的 VTAP 数据包数

网络负载均衡器发送的 VTAP 数据包数量。

Sum

Count

网络负载均衡器发送的 VTAP 字节数

网络负载均衡器发送的 VTAP 字节数量。

Sum

字节

网络负载均衡器丢弃的 VTAP 数据包数

网络负载均衡器丢弃的 VTAP 数据包数量。

Sum

Count

网络负载均衡器健康后端数

网络负载均衡器中健康后端服务器的数量。

Maximum

Count

网络负载均衡器不健康后端数

网络负载均衡器中不健康后端服务器的数量。

Maximum

Count

网络负载均衡器入站丢包数

网络负载均衡器因错误、拥塞或配置问题丢弃的入站数据包数量。

Sum

Count

严重后端集数 因严重健康问题或故障处于严重状态的后端集数量。 Sum Count
告警后端集数 存在潜在问题需要关注的后端集数量。 Sum Count
未知状态后端集数 健康状态未知(可能因数据缺失或连接问题)的后端集数量。 Sum Count
正常后端集数 健康且正常运行的后端集数量。 Sum Count
严重后端集占比 当前处于严重状态的后端集占总后端集的百分比。 Mean 百分比
告警后端集占比 当前处于告警状态的后端集占总后端集的百分比。 Mean 百分比
未知状态后端集占比 健康状态未知的后端集占总后端集的百分比。 Mean 百分比
正常后端集占比 正常运行的后端集占总后端集的百分比。 Mean 百分比
已排空后端集数 已被标记为排空状态的后端集数量。 Mean Count
已排空后端集占比 当前处于排空状态的后端集占总后端集的百分比。 Mean 百分比

后端集

以下是后端集监视器支持的指标:

指标名称 描述 统计方式 单位
后端服务器数 后端集中后端服务器的数量。 Maximum Count
不健康后端服务器数 后端集中不健康后端服务器的数量。 Maximum Count
严重后端数 因严重健康问题或故障处于严重状态的后端数量。 Sum Count
告警后端数 存在潜在问题需要关注的后端数量。 Sum Count
未知状态后端数 健康状态未知(可能因数据缺失或连接问题)的后端数量。 Sum Count
正常后端数 健康且正常运行的后端数量。 Sum Count
严重后端占比 当前处于严重状态的后端占总后端的百分比。 Mean 百分比
告警后端占比 当前处于告警状态的后端占总后端的百分比。 Mean 百分比
未知状态后端占比 健康状态未知的后端占总后端的百分比。 Mean 百分比
正常后端占比 正常运行的后端占总后端的百分比。 Mean 百分比
已排空后端数 已被标记为排空状态的后端数量。 Mean Count
已排空后端占比 当前处于排空状态的后端占总后端的百分比。 Mean 百分比

阈值配置

为网络负载均衡器监视器配置阈值的步骤:

  1. 登录您的 Site24x7 账户,导航至管理 > 配置文件 > 阈值与可用性
  2. 单击添加阈值配置文件
  3. 监视器类型下拉菜单中选择 OCI 网络负载均衡器,并在显示名称字段中填写合适的名称。
  4. 支持的指标将显示在阈值配置部分。您可以为上述所有指标设置阈值。
  5. 单击保存

OCI 网络负载均衡器监视器的状态传播

OCI 网络负载均衡器集成支持后端集和监听器的状态传播

启用状态传播后:

  • 后端集和监听器的告警默认处于禁用状态。
  • 子监视器的状态变更告警将被抑制,除非您在编辑阈值页面中将跳过告警设为
  • 您只会收到来自父级网络负载均衡器监视器的告警。

这确保了在网络负载均衡层面的告警集中管理。

注意

支持状态传播的子监视器的告警会自动禁用。

例如,如果某个监听器出现故障或变得不可用,父级网络负载均衡器监视器将发出一条告警,指示存在网络负载均衡问题。

许可证

  • 每个网络负载均衡器监视器使用一个基础监视器许可证
  • 每个后端集监视器使用一个基础监视器许可证。
  • 监听器监视器为免费监视器。

查看网络负载均衡器数据

要监控您的网络负载均衡器环境,请登录您的 Site24x7 账户,导航至 > OCI > 网络负载均衡器

监视器数据

网络负载均衡器

以下是网络负载均衡器监视器的监控数据。

摘要

摘要选项卡以图表形式提供事件时间线和指标的概述。

后端集

后端集选项卡显示后端集可用性详情,以及与网络负载均衡器监视器关联的后端集监视器列表。单击所需的监视器名称超链接,可查看后端集监视器数据。

监听器

监听器选项卡显示监听器可用性详情,以及与网络负载均衡器监视器关联的监听器监视器列表。单击所需的监视器名称超链接,可查看监听器监视器数据。

配置

配置选项卡中,您可以查看负载均衡器监视器的基本配置详情,如负载均衡器名称区域分区 IDOCID

Zia 预测

使用 Zia 预测功能,预测已处理字节数和已处理数据包数指标的未来值。根据历史观测数据预测这些性能指标(资源使用量的衡量)的未来走势,并做出明智决策。系统使用 15 天的历史数据来预测未来 7 天的指标使用情况。

中断记录

中断记录选项卡提供中断的开始时间、结束时间、持续时长和备注(如有)等详情。

清单

清单选项卡中,您可以获取负载均衡器名称区域监视器许可证类别等详情,并根据用户设置和查看阈值与可用性配置文件及通知配置文件。

日志报表

日志报表选项卡提供网络负载均衡器监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

告警日志选项卡按时间顺序显示与网络负载均衡器监视器相关的所有已触发告警列表。此选项卡帮助您追踪告警历史记录和严重性,以便评估问题并验证阈值设置。

后端集

以下是后端集监视器的监控数据。

摘要

摘要选项卡以图表形式提供事件时间线和指标的概述。您还可以在此选项卡中查看后端健康状态详情。

配置

配置选项卡中,您可以查看后端集监视器的基本配置详情,如负载均衡器名称整体健康状态区域策略。此外,此选项卡还提供健康检查配置详情。

后端

后端选项卡显示后端详情,包括资源名称IP 地址端口权重。您可以使用资源名称IP 地址端口等选项筛选资源。

注意

如果后端集监视器与正在被 Site24x7 监控的 OCI 计算实例集成,则实例名称将出现在 资源名称列中。单击此实例名称将跳转到对应的监视器详情页面。

中断记录

中断记录选项卡提供中断的开始时间、结束时间、持续时长和备注(如有)等详情。

清单

清单选项卡中,您可以获取负载均衡器名称区域监视器许可证类别等详情,并根据用户设置和查看阈值与可用性配置文件通知配置文件

日志报表

日志报表选项卡提供后端集监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

告警日志选项卡按时间顺序显示与后端集监视器相关的所有已触发告警列表。此选项卡帮助您追踪告警历史记录和严重性,以便评估问题并验证阈值设置。

监听器

以下是监听器监视器的监控数据。

摘要

摘要选项卡提供事件时间线和可用性详情的概述。

配置

配置选项卡中,您可以查看监听器监视器的基本配置详情,如监听器名称后端集名称区域端口

中断记录

中断记录选项卡提供中断的开始时间、结束时间、持续时长和备注(如有)等详情。

清单

清单选项卡中,您可以获取负载均衡器名称区域监视器许可证类别等详情,并根据用户设置和查看阈值与可用性配置文件通知配置文件

日志报表

日志报表选项卡提供监听器监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

告警日志选项卡按时间顺序显示与监听器监视器相关的所有已触发告警列表。此选项卡帮助您追踪告警历史记录和严重性,以便评估问题并验证阈值设置。

相关主题

负载均衡器监控

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!