AWS Gateway Load Balancer 监控
Site24x7 与 AWS Gateway Load Balancer 的集成可帮助您监控 Gateway Load Balancer 配置的健康状况和性能。通过从 AWS 收集指标和配置数据,Site24x7 使您能够了解流量如何路由到虚拟私有云中部署的第三方设备(如防火墙和流量检测工具)。Site24x7 还会跟踪目标组、可用区和端点连接等关联组件,帮助您隔离问题并优化网络流量。
此集成会为 Gateway Load Balancer(GWLB)关联的每个目标组创建一个专属子监视器,但仅适用于新创建的监视器,不适用于当前工作流下已集成的 Gateway Load Balancer 监视器。
使用场景
如果您正在运行一批虚拟设备用于深度包检测或防火墙过滤,您可能会使用 AWS Gateway Load Balancer 以可扩展且容错的方式将流量分发到这些设备。
通过 Site24x7 的集成,您可以监控流量在负载均衡器中的流转情况,并检查流量是否均匀分发到所有设备。当端点连接失败或任何可用区出现不健康状态时,您将收到告警,帮助您的网络团队快速定位问题,确保流量检测不中断。
Site24x7 GWLB 集成的优势
将 AWS Gateway Load Balancer 环境与 Site24x7 集成,可获得以下优势:
- 集中可见性:在单一控制台中监控跨地区的所有 GWLB。
- 目标组级别洞察:自动为每个目标组创建专属子监视器,提供有关后端健康状况和性能的详细数据。
- 主动告警:当超过配置的阈值时发送实时告警,有助于减少宕机时间。
- 历史数据与趋势:访问历史性能数据,以了解流量模式并更有效地规划容量。
设置与配置
- 登录您的 Site24x7 账户。
- 前往云 > AWS > 集成 AWS 账户,创建跨账户 IAM 角色以使 Site24x7 能够访问您的 AWS 资源。
- 在集成 AWS 账户页面,根据需求从待发现服务列表中选择 Elastic Load Balancer。
策略与权限
需要将以下只读权限分配给已创建的 IAM 或跨账户角色,以帮助发现和监控 Gateway Load Balancer。
- "elasticloadbalancing:DescribeLoadBalancers",
- "elasticloadbalancing:DescribeTags",
- "elasticloadbalancing:DescribeListeners",
- "elasticloadbalancing:DescribeAccountLimits",
- "ec2Instance:describeVpcEndpoints",
- "ec2Instance:describeVpcEndpointServiceConfigurations"
监控目标组监视器需要以下权限:
- "elasticloadbalancing:DescribeTargetHealth",
- "elasticloadbalancing:DescribeTargetGroups"
轮询间隔
Site24x7 按照设置的轮询频率(从每分钟一次到每天一次)轮询 CloudWatch API 和其他服务级别 API,以收集性能指标和元数据。
其他支持的性能计数器
支持的指标
Gateway Load Balancer
以下是 Gateway Load Balancer 监视器支持的指标。
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
|
Active flow count |
从客户端到目标的并发流(或连接)总数。 |
Average |
Count |
|
Connected endpoints |
连接到 GWLB 的端点总数。 |
Sum |
Count |
|
Consumed LCUs |
负载均衡器使用的负载均衡器容量单位(LCU)数量。 |
Sum and average |
Unit |
|
New flow count |
在统计时间段内从客户端到目标新建的流(或连接)总数。 |
Sum |
Count |
|
Processed bytes |
负载均衡器处理的字节总数;此计数包括往返目标的流量,但不包括健康检查流量。 |
Sum |
MB |
|
Total unhealthy host count |
被视为不健康的目标数量。 |
Sum |
Count |
|
Total Healthy host count |
被视为健康的目标数量。 |
Sum |
Count |
可用区
以下是支持的可用区指标。
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
|
Active flow count |
每个可用区内从客户端到目标的并发流(或连接)总数。 |
Average |
Count |
|
Processed bytes |
每个可用区内负载均衡器处理的字节总数;此计数包括往返目标的流量,但不包括健康检查流量。 |
Sum |
MB |
|
New flow count |
在统计时间段内每个可用区内从客户端到目标新建的流(或连接)总数。 |
Sum |
Count |
目标组
以下是目标组监视器支持的指标。
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
|
Healthy host count |
注册到 GWLB 的健康目标数量。 |
Sum |
Count |
|
Unhealthy host count |
挂载到 GWLB 的不健康目标数量。 |
Sum |
Count |
Gateway Load Balancer 配置属性
| 属性名称 | 描述 |
|---|---|
|
ELB name |
负载均衡器的名称。 |
|
Region |
创建 GWLB 实例的地区名称。 |
|
ELB type |
负载均衡器的类型。 |
|
Creation time |
GWLB 节点的创建时间。 |
|
Availability zones |
GWLB 节点所在的可用区。 |
|
VPC ID |
部署在 Amazon VPC 内的负载均衡器的 ID。 |
|
Deletion protection enabled |
显示 GWLB 的删除保护是否已启用。 |
|
Load balancing cross zone enabled |
显示 GWLB 的跨区负载均衡是否已启用。 |
阈值配置
为 Gateway Load Balancer 监视器配置阈值:
- 登录 Site24x7 账户,导航至管理 > 配置文件 > 阈值与可用性。
- 点击添加阈值配置文件。
- 从监视器类型下拉菜单中选择 Gateway Load Balancer 监视器类型。
- 在显示名称字段中填写适当的名称。
- 支持的指标显示在阈值配置部分。您可以为上述所有指标设置阈值。
- 点击保存。
许可证
- 每个 Gateway Load Balancer 监视器使用一个基础监视器许可证。
- 每个目标组监视器为免费监视器。
预测
估算以下 GWLB 性能指标的未来值,从而为扩容或扩展 AWS 基础设施做出明智决策:
- Consumed LCUs
查看 Gateway Load Balancer 监视器
若要监控 GWLB 环境,请登录 Site24x7 账户,导航至云 > AWS > Gateway Load Balancer。
监视器数据
Gateway Load Balancer
以下是 Gateway Load Balancer 监视器的数据说明。
Gateway Load Balancer
Gateway Load Balancer 选项卡以图表形式提供事件时间线和指标的概览。
目标组
目标组是一组目标(例如 EC2 实例、IP 地址或 Lambda 函数),Application Load Balancer、Network Load Balancer 或 Gateway Load Balancer 将流量路由到这些目标。
在目标组选项卡中,您可以查看挂载到 Gateway Load Balancer 的目标组,还可以查看每个目标组中健康主机和不健康主机的数量。
点击单个条目可查看目标组监视器数据。
可用区
此选项卡显示 Gateway Load Balancer 在 AWS 地区不同可用区的运行情况。
查看与 GWLB 关联的受监控 ACM 监视器及其他资源列表。点击单个条目可查看该资源关联的性能和资源使用统计信息。您还可以通过点击操作列下的铅笔图标来设置阈值,并在这些服务出现故障时收到通知。
在当前工作流中,对于已集成的 Gateway Load Balancer 监视器,EC2 实例和其他资源列在 Gateway Load Balancer 监视器的受监控资源选项卡下。在适用于新集成监视器的新流程中,EC2 实例将仅列在目标组监视器下,而 ACM 监视器将继续显示在 Gateway Load Balancer 监视器的受监控资源 选项卡中。
端点连接
端点连接选项卡显示与 GWLB 集成的端点连接监视器。点击各个监视器名称可查看端点监视器数据。
拓扑视图
拓扑视图选项卡提供实时的以资源为中心的依赖关系图。它动态追踪 GWLB 资源与周边 AWS 基础设施的连接关系,从而在告警触发时加快根因定位。如果任何关联组件处于严重状态,它将在拓扑视图中被相应标记,并显示中断原因,让您无需离开监视器页面即可确定确切的故障点。与账户级拓扑视图不同,此选项卡将可视化范围限定为单个资源,精确回答:这个 GWLB 资源连接到什么,如果它出现故障会影响什么?您可以从单个资源追踪完整的依赖链,直至其主要父实体、服务类型、地区和 AWS 账户级别。
Zia 预测
Zia 预测图表根据历史时间序列数据显示性能指标(资源使用量的度量值)的未来预测点。使用 15 天的历史数据来预测未来 7 天的指标使用情况。
配置详情
在此选项卡中查看配置详情,例如地区、可用区、ELB 类型和 DNS 名称。
中断
中断选项卡提供中断的开始时间、结束时间、持续时间及备注(如有)等详细信息。
清单
在清单选项卡中获取 ELB 名称、检查频率和监视器许可证类别等详细信息。阈值与可用性配置文件和通知配置文件可根据用户设置,并在此选项卡中查看。
日志报表
此选项卡提供每个 Gateway Load Balancer 监视器日志状态的汇总报表,可下载为 CSV 文件。
告警日志
此选项卡以时间顺序显示与 Gateway Load Balancer 监视器相关的所有已触发告警列表,有助于追踪告警历史和严重程度,以便评估问题并验证阈值设置。
目标组
概要
概要选项卡以图表形式全面呈现事件时间线和指标,深入展示目标组环境中配置指标的性能和行为。
目标
目标选项卡详细展示 GWLB 下注册的每个目标的健康状态。对于每个目标,您可以查看实例 ID、可用区和当前健康状态等详情,帮助您快速识别哪些目标出现故障及原因。您还可以看到每个可用区中健康、不健康、未使用、初始化中或正在排空的目标数量概览,有助于定位区域级问题并了解流量分发是否均匀。
属性
属性选项卡显示控制目标组内流量处理方式的关键配置设置。
受监控资源
查看与 GWLB 关联的受监控 EC2 实例列表。点击单个条目可查看该资源关联的性能和资源使用统计信息。您还可以通过点击操作列下的铅笔图标来设置阈值,并在这些服务出现故障时收到通知。
拓扑视图
拓扑视图选项卡提供实时的以资源为中心的依赖关系图。它动态追踪目标组资源与周边 AWS 基础设施的连接关系,从而在告警触发时加快根因定位。如果任何关联组件处于严重状态,它将在拓扑视图中被相应标记,并显示中断原因,让您无需离开监视器页面即可确定确切的故障点。与账户级拓扑视图不同,此选项卡将可视化范围限定为单个资源,精确回答:这个目标组资源连接到什么,如果它出现故障会影响什么?您可以从单个资源追踪完整的依赖链,直至其主要父实体、服务类型、地区和 AWS 账户级别。
Zia 预测
Zia 预测图表根据历史时间序列数据显示性能指标(资源使用量的度量值)的未来预测点。使用 15 天的历史数据来预测未来 7 天的指标使用情况。
配置
在此选项卡中查看配置详情,例如目标组配置和健康检查配置。
中断
中断选项卡提供中断的开始时间、结束时间、持续时间及备注(如有)等详细信息。
清单
在清单选项卡中获取 ELB 名称、检查频率和监视器许可证类别等详细信息。阈值与可用性配置文件和通知配置文件可根据用户设置,并在此选项卡中查看。
日志报表
此选项卡提供每个目标组监视器日志状态的汇总报表,可下载为 CSV 文件。
告警日志
此选项卡以时间顺序显示与目标组监视器相关的所有已触发告警列表,有助于追踪告警历史和严重程度,以便评估问题并验证阈值设置。
相关主题
