AWS Network Load Balancer 监控
Site24x7 与 AWS Network Load Balancer 原生集成,使您能够监控负载均衡器及其后端目标的性能和可用性。集成后,Site24x7 将自动发现您 AWS 账户中的网络负载均衡器(NLB)资源,并为每个负载均衡器及其关联的目标组单独创建监视器。
此集成将为与 NLB 关联的每个目标组创建专属子监视器,但仅适用于新创建的监视器,不适用于已在当前工作流下集成的 NLB 监视器。
使用场景
一家运营大规模应用程序的企业通过 AWS Network Load Balancer 处理大量传输控制协议(TCP)流量,需要保持高服务可靠性和性能。
通过将这些 NLB 与 Site24x7 集成,企业可以从单一仪表板监控所有负载均衡器的连接指标。当阈值被突破时(例如健康目标突然减少或活跃连接数激增),即可收到告警。Site24x7 还提供对各个目标组健康状况的可见性,更便于定位后端问题。这有助于运营团队及早发现问题并迅速采取行动,减少宕机时间并提升整体用户体验。
Site24x7 NLB 集成的优势
将 AWS Network Load Balancer 环境与 Site24x7 集成,可获得以下优势:
- 集中可视化:在单一控制台中监控跨区域的所有 NLB。
- 目标组级别洞察:系统为每个目标组自动创建专属子监视器,提供后端健康状况和性能的详细数据,有助于在无需手动翻查日志的情况下,直接定位并解决问题根源。
- 主动告警:当配置的阈值被突破时,即时发送告警,帮助减少宕机时间。
- 历史数据与趋势:访问历史性能数据,了解流量模式,更有效地规划容量。
配置
- 登录您的 Site24x7 账户。
- 前往云 > AWS > 集成 AWS 账户,创建跨账户 IAM 角色,使 Site24x7 能够访问您的 AWS 资源。
- 在集成 AWS 账户页面,根据您的需求从要发现的服务列表中选择弹性负载均衡器。
策略与权限
需要将以下只读权限分配给创建的 IAM 或跨账户角色,以帮助发现和监控 Network Load Balancer。
- "elasticloadbalancing:DescribeLoadBalancers",
- "elasticloadbalancing:DescribeTags",
- "elasticloadbalancing:DescribeListeners",
- "elasticloadbalancing:DescribeAccountLimits",
监控目标组监视器需要以下权限:
- "elasticloadbalancing:DescribeTargetHealth",
- "elasticloadbalancing:DescribeTargetGroups"
轮询间隔
Site24x7 根据设定的轮询频率(每分钟一次至每天一次)轮询 CloudWatch API 和其他服务级别 API,以收集性能指标和元数据。
其他支持的性能计数器
支持的指标
Network Load Balancer
NLB 监视器支持的指标如下所示。
| 指标名称 | 描述 | 统计值 | 单位 |
|---|---|---|---|
|
Active flow count |
衡量客户端与目标之间 TCP 流或连接的总数。 |
Sum |
Count |
|
Consumed LCUs |
衡量 NLB 使用的负载均衡器容量单元数量。 |
Sum and Average |
Units |
|
Healthy host count |
衡量已注册到 NLB 的健康目标数量。 |
Maximum |
Count |
|
Processed bytes |
衡量 NLB 处理的总字节数。 |
Sum |
Bytes |
|
New flow count |
衡量客户端与目标之间建立的新 TCP 流或连接总数。 |
Sum |
Count |
|
TCP client reset count |
衡量从目标发送到客户端的重置数据包总数。 |
Sum |
Count |
|
TCP ELB reset count |
衡量由负载均衡器生成的数据包总数。 |
Sum |
Count |
|
TCP target reset count |
衡量从目标发送到客户端的重置数据包总数。 |
Sum |
Count |
|
Unhealthy host count |
衡量挂接到网络负载均衡器的不健康目标数量。 |
Maximum |
Count |
目标组
目标组监视器支持的指标如下所示。
| 指标名称 | 描述 | 统计值 | 单位 |
|---|---|---|---|
|
Healthy host count |
衡量已注册到网络负载均衡器的健康目标数量。 |
Sum |
Count |
|
Unhealthy host count |
衡量挂接到网络负载均衡器的不健康目标数量。 |
Sum |
Count |
Network Load Balancer 配置属性
| 属性名称 | 描述 |
|---|---|
|
ELB name |
网络负载均衡器的名称。 |
|
Scheme |
显示 NLB 是面向内部还是面向互联网。 |
|
Region |
显示 NLB 部署所在的区域。 |
|
ARN |
显示分配给 NLB 的唯一 Amazon 资源名称。 |
|
Availability zones |
显示 NLB 的可用区和指定子网。 |
|
ELB type |
显示正在使用的负载均衡器类型,例如网络型。 |
|
DNS name |
显示 NLB 的 DNS 名称。 |
|
Creation time |
显示 NLB 的创建时间。 |
|
VPC ID |
列出 NLB 部署所在的 Virtual Private Cloud 的 ID。 |
|
Listeners |
列出 NLB 的监听器配置(端口和协议)。 |
阈值配置
为 NLB 监视器配置阈值:
- 登录您的 Site24x7 账户,导航至管理 > 配置文件 > 阈值与可用性。
- 点击添加阈值配置文件。
- 从监视器类型下拉菜单中选择 Network Load Balancer 监视器类型。
- 在显示名称字段中提供适当的名称。
- 支持的指标将显示在阈值配置部分,您可以为上述所有指标设置阈值。
- 点击保存。
许可
- 每个 Network Load Balancer 监视器使用一个基本监视器许可证。
- 每个目标组监视器为免费监视器。
预测
估算以下 NLB 性能指标的未来值,并就增加容量或扩展 AWS 基础设施做出明智决策:
- Consumed LCUs
查看 Network Load Balancer 监视器
要监控您的 Network Load Balancer 环境,请登录您的 Site24x7 账户,导航至云 > AWS > Network Load Balancer。
监视器数据
Network Load Balancer
Network Load Balancer 监视器的监控数据如下所示。
ELB 摘要
ELB 摘要标签页以图表形式提供事件时间线和指标的概述。
目标组
目标组是一组目标(例如 EC2 实例、IP 地址或 Lambda 函数)的集合,Application Load Balancer、Network Load Balancer 或 Gateway Load Balancer 将流量路由到这些目标。
在目标组标签页中,您可以查看挂接到您的 Network Load Balancer 的目标组。此外,您还可以查看每个目标组中健康主机和不健康主机的数量。
点击单个列表项可查看目标组监视器数据。
查看与您的 NLB 关联的已监控 ACM 监视器和其他资源列表。点击单个列表项可查看该资源的性能和资源使用统计信息。您还可以通过点击操作下的铅笔图标来设置阈值,并在这些服务出现故障时收到通知。
在当前工作流中,对于已集成的 Network Load Balancer 监视器,EC2 实例和其他资源列在 Network Load Balancer 监视器的已监控资源标签页下。在新的工作流中(适用于新集成的监视器),EC2 实例将仅列在目标组监视器下,而 ACM 监视器将继续显示在 Network Load Balancer 监视器的已监控资源标签页中。
拓扑视图
拓扑视图标签页提供实时的、以资源为中心的依赖关系图。它动态追踪您的 NLB 资源与周围 AWS 基础设施的实时连接关系,在告警触发时能更快速地定位根本原因。如果任何连接的组件处于严重状态,拓扑视图中会相应标记,并显示中断原因,让您无需离开监视器页面即可精准定位故障点。与账户范围的拓扑视图不同,此标签页将可视化范围限定为单个资源,精确回答以下问题:此 NLB 资源连接到哪些资源,以及它出现故障时会影响什么?您可以从单个资源追踪完整的依赖链,直至其主要父实体、服务类型、区域和 AWS 账户级别。
Zia 预测
Zia 预测图表基于历史时间序列数据,显示性能指标(资源使用情况的度量)的未来值。系统使用 15 天的历史数据来预测未来 7 天的指标使用情况。
配置详情
在此标签页中查看配置详情,例如区域、可用区、ELB 类型和 DNS 名称。
中断
中断标签页提供中断的开始时间、结束时间、持续时长和评论(如有)的详情。
资源清单
在资源清单标签页上获取 ELB 名称、检查频率和监视器许可类别等详情。可根据用户设置阈值与可用性配置文件和通知配置文件,并在此标签页上查看。
日志报表
此标签页提供每个 Network Load Balancer 监视器日志状态的汇总报表,可下载为 CSV 文件。
告警日志
此标签页显示与 Network Load Balancer 监视器相关的所有已触发告警的时间顺序列表,帮助您追踪告警历史和严重程度,以评估问题并验证阈值设置。
目标组
摘要
摘要标签页提供事件时间线和指标的全面概述,以富有洞察力的图表形式呈现目标组环境中已配置指标的性能和行为信息。
目标
目标标签页提供 NLB 下注册的每个目标的健康状态详细视图。对于每个目标,您可以查看实例 ID、可用区和当前健康状态等详情,帮助您快速识别哪些目标出现故障及其原因。您还可以查看每个可用区中健康、不健康、未使用、正在初始化或正在排空的目标数量汇总,此分类有助于您定位特定区域的问题,并了解流量的分配是否均衡。
属性
属性标签页显示控制目标组内流量处理方式的关键配置设置。
查看与您的 NLB 关联的已监控 EC2 实例列表。点击单个列表项可查看该资源的性能和资源使用统计信息。您还可以通过点击操作下的铅笔图标来设置阈值,并在这些服务出现故障时收到通知。
拓扑视图
拓扑视图标签页提供实时的、以资源为中心的依赖关系图。它动态追踪您的目标组资源与周围 AWS 基础设施的实时连接关系,在告警触发时能更快速地定位根本原因。如果任何连接的组件处于严重状态,拓扑视图中会相应标记,并显示中断原因,让您无需离开监视器页面即可精准定位故障点。与账户范围的拓扑视图不同,此标签页将可视化范围限定为单个资源,精确回答以下问题:此目标组资源连接到哪些资源,以及它出现故障时会影响什么?您可以从单个资源追踪完整的依赖链,直至其主要父实体、服务类型、区域和 AWS 账户级别。
Zia 预测
Zia 预测图表基于历史时间序列数据,显示性能指标(资源使用情况的度量)的未来值。系统使用 15 天的历史数据来预测未来 7 天的指标使用情况。
配置
在此标签页中查看配置详情,例如目标组配置和健康检查配置。
中断
中断标签页提供中断的开始时间、结束时间、持续时长和评论(如有)的详情。
资源清单
在资源清单标签页上获取 ELB 名称、检查频率和监视器许可类别等详情。可根据用户设置阈值与可用性配置文件和通知配置文件,并在此标签页上查看。
日志报表
此标签页提供每个目标组监视器日志状态的汇总报表,可下载为 CSV 文件。
告警日志
此标签页显示与目标组监视器相关的所有已触发告警的时间顺序列表,帮助您追踪告警历史和严重程度,以评估问题并验证阈值设置。
相关主题
