NAT 网关监控
网络地址转换 (NAT) 网关使私有子网中的实例能够访问互联网,同时不将这些实例暴露于入站互联网流量。它为私有资源提供了发起出站连接的方式,同时保持其安全性。
概述
NAT 网关作为出站互联网流量的关键路径,对其进行监控至关重要。任何中断、延迟或配置错误,若缺乏对网关本身的可见性,都可能导致难以追踪的下游问题。
Site24x7 与 OCI NAT 网关的集成有助于填补这一空白,提供端到端监控。它能捕获使用模式、追踪性能指标,并在出现异常时发出告警,让您能够在用户或依赖系统受到影响之前迅速采取行动。该集成对于管理依赖稳定出站互联网访问的关键工作负载的团队尤为有用,例如更新服务器、后端作业或数据同步服务。
使用场景
一家托管在 OCI 上的医疗分析平台依赖一组计算实例,定期从经批准的第三方 API 下载医疗数据集。出于安全考虑,这些实例未配置公共 IP,而是通过 NAT 网关进行出站访问。
某天,数据同步作业开始间歇性失败。Site24x7 发现 NAT 网关出站流量下降,同时错误数量增加,并识别出 NAT 网关因路由设置配置变更而触及了软限制。
基于此洞察,运维团队纠正了路由设置并恢复了流量。如果没有 Site24x7 的监控,团队将不得不手动排查各个组件的日志才能发现问题。通过持续追踪网关指标并对流量阈值和错误数量设置告警,Site24x7 有助于避免类似中断,并确保时效性分析任务的数据可靠传输。
Site24x7 NAT 网关集成的优势
将您的 NAT 网关与 Site24x7 集成,可获得以下优势:
- 集中可见性:将 NAT 网关指标与其他 OCI 资源(如计算实例、VCN 和路由表)一起追踪。
- 主动告警:设置阈值并在阈值违规时立即收到告警,从而快速响应潜在问题。
- 性能追踪:随时间查看入/出字节数和活跃连接数等关键指标,了解使用趋势。
- 故障排除支持:利用历史数据识别连接问题发生的时间和位置。
设置与配置
- Site24x7 使用跨租户访问通过 Site24x7 的租户用户监控您的资源。登录您的 Site24x7 账户,创建特定策略,允许 Site24x7 在不影响您安全性的情况下查看您的资源。
- 在集成 OCI 监视器页面上,从待发现服务列表中选择 NAT Gateway。
策略和权限
请确保关联的 OCI 策略包含以下声明:
- "read nat-gateways"
轮询频率
Site24x7 根据设定的轮询频率(从每分钟一次到每天一次)查询 OCI 服务级别 API,以收集 NAT 网关监视器的指标。
支持的指标
以下为 NAT 网关监视器支持的指标:
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
|
从 OCI 资源到 NAT 网关的字节数 |
从 Oracle Cloud Infrastructure (OCI) 资源发送到 NAT 网关的字节数。 |
总计 |
字节 |
|
从 NAT 网关到 OCI 资源的字节数 |
从 NAT 网关发送到 OCI 资源的字节数。 |
总计 |
字节 |
|
从 OCI 资源到 NAT 网关的数据包数 |
从 OCI 资源发送到 NAT 网关的数据包数。 |
总计 |
数量 |
|
从 NAT 网关到 OCI 资源的数据包数 |
从 NAT 网关发送到 OCI 资源的数据包数。 |
总计 |
数量 |
|
从 OCI 资源到 NAT 网关的数据包丢失数 |
从 OCI 资源发送到 NAT 网关但被 NAT 网关丢弃的数据包数。 |
总计 |
数量 |
|
通过 NAT 网关建立的连接数 |
通过 NAT 网关建立的连接数。 |
总计 |
数量 |
|
通过 NAT 网关且由远端关闭的连接数 |
通过 NAT 网关且由互联网主机关闭的连接数。 |
总计 |
数量 |
|
因空闲超时被 NAT 网关关闭的连接数 |
因空闲超时被 NAT 网关关闭的连接数。 |
总计 |
数量 |
|
总字节数 |
NAT 网关处理的总字节数(含收发两个方向)的聚合指标。 |
总计 |
字节 |
|
总数据包数 |
NAT 网关处理的所有数据包(含收发两个方向)的总计数量。 |
总计 |
数量 |
|
总丢弃数 |
所有类别(无端口、限流或其他)的数据包丢失总量。这是一个关键健康指标,表明整体数据包丢失情况及 NAT 网关的潜在性能问题。 |
总计 |
数量 |
|
丢弃率 |
丢弃数据包占已处理数据包总数的计算百分比。这是反映 NAT 网关健康状况和效率的关键性能指标。数值超过 1-2% 通常表明基础设施存在需要关注的问题。 |
平均值 |
百分比 |
阈值配置
为 NAT 网关监视器配置阈值的步骤:
- 登录您的 Site24x7 账户,导航至管理 > 配置文件 > 阈值和可用性。
- 单击添加阈值配置文件。
- 从监视器类型下拉菜单中选择 NAT Gateway,并在显示名称字段中输入适当的名称。
- 阈值配置部分将显示支持的指标。您可以为上述所有指标设置阈值。
- 单击保存。
许可证
- 每个 NAT 网关监视器消耗一个基本监视器许可证。
查看 NAT 网关数据
要监控您的 NAT 网关环境,请登录您的 Site24x7 账户,导航至云 > OCI > NAT Gateway。
监视器数据
以下为 NAT 网关监视器的数据说明。
摘要
摘要标签页提供事件时间线和指标的全面概览,通过直观图表展示 NAT 网关监视器的性能状况。
配置
配置标签页汇总了 NAT 网关监视器的关键信息,包括其 NAT IP、创建时间、状态及其他配置详情。
Zia 预测
Zia 预测标签页显示基于历史时序数据的预测图表,展示性能指标(资源使用量的度量)的未来趋势点。系统使用 15 天的历史数据预测未来 7 天的指标使用情况。
中断
中断标签页提供中断的开始时间、结束时间、持续时长及备注(如有)等详细信息。
库存
从库存标签页可获取资源名称、区域、监视器许可证类别等详细信息。阈值和可用性配置文件及通知配置文件可根据用户需求进行设置,并在此标签页中查看。
日志报表
此标签页提供 NAT 网关监视器日志状态的汇总报表,可下载为 CSV 文件。
告警日志
此标签页按时间顺序显示与 NAT 网关监视器相关的所有已触发告警列表。通过此标签页,您可以追踪告警历史和严重程度,以评估问题并验证阈值设置。
