互联网网关监控
在 Oracle Cloud Infrastructure(OCI)中,互联网网关允许公共子网中的资源连接到互联网,为入站和出站流量提供路径,对于需要直接互联网访问的工作负载(如 Web 服务器或 API)至关重要。

Site24x7 对 OCI 互联网网关的监控可让您深入了解网关的使用情况,并确保面向公众的资源具备可靠的连接性。
概述
在大多数生产环境中,互联网网关是关键应用的入口和出口点。如果配置错误、不可用或被删除,将立即中断对您服务的公共访问。尽管其重要性不言而喻,但 OCI 原生对互联网网关的监控能力有限。除非手动通过日志或网络故障排除进行追踪,否则无法直接针对可用性或配置问题发出告警。
Site24x7 的集成通过将互联网网关监控纳入您现有的基础设施可见性体系来弥补这一不足。您现在可以在查看其他受监控 OCI 资源的同时,查看互联网网关的可用性、配置状态和相关指标。这有助于及早发现潜在问题,缩短排查连接问题所花费的时间。
使用场景
设想一个团队在 OCI 上运行一组面向公众的微服务,这些服务托管在虚拟云网络(VCN)内的公共子网中,客户通过互联网访问这些服务。为该 VCN 配置的互联网网关是允许这些服务对外发送和接收流量的唯一节点。某天,客户报告应用无法访问,工程团队开始排查,但未发现应用服务器或负载均衡器存在任何问题。
通过 Site24x7,他们迅速检查互联网网关的状态,发现其在最近一次配置更新期间意外从 VCN 断开。由于 Site24x7 提供了对互联网网关附加状态和路由依赖关系的可见性,团队得以快速识别并修复问题。如果网关被删除或禁用,Site24x7 的告警系统将实时标记该事件。
此集成有助于缩短平均修复时间,防止长时间宕机,并避免在整个网络栈中进行大量手动调试的必要。
Site24x7 互联网网关集成的优势
将您的互联网网关与 Site24x7 集成,可获得以下优势:
- 保持连接性:确保云资源关键出站和入站通信路径的可用性。
- 监控流量模式:追踪流量流向,检测可能指示问题的异常峰值或下降。
- 优化配置:识别错误配置或未使用的网关,优化您的云设置。
- 故障排除支持:利用历史数据识别连接问题发生的时间和位置。
- 主动告警:设置阈值并在阈值触发时立即接收告警,以便快速响应潜在问题。
设置与配置
- Site24x7 使用跨租户访问通过 Site24x7 的租户用户监控您的资源。登录您的 Site24x7 账户,创建特定策略,以允许 Site24x7 在不影响您安全性的前提下查看您的资源。
- 在集成 OCI 监视器页面中,从待发现服务列表中选择互联网网关。
策略与权限
确保关联的 OCI 策略包含以下声明:
- "read internet-gateway"
轮询频率
Site24x7 按照设定的轮询频率(从每分钟一次到每天一次)查询 OCI 服务级别 API,以从互联网网关监视器采集指标。
支持的指标
以下是互联网网关监视器支持的指标:
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
|
发往互联网网关的字节数 |
OCI 资源发送至互联网网关的字节数,用于出站互联网流量。 |
总和 |
字节 |
|
来自互联网网关的字节数 |
互联网网关发送至 OCI 资源的字节数,用于入站互联网流量。 |
总和 |
字节 |
|
发往互联网网关的数据包数 |
OCI 资源发送至互联网网关的数据包数,用于出站互联网通信。 |
总和 |
数量 |
|
来自互联网网关的数据包数 |
互联网网关发送至 OCI 资源的数据包数,用于入站互联网通信。 |
总和 |
数量 |
|
发往互联网网关的数据包丢弃数 |
OCI 资源发往互联网网关的数据包中,因各种原因被互联网网关丢弃的总数。 |
总和 |
数量 |
|
来自互联网网关的数据包丢弃数 |
互联网网关发往 OCI 资源的数据包中,因各种过滤或路由问题被丢弃的总数。 |
总和 |
数量 |
|
发往 IGW 的数据包丢弃数 - 安全规则 |
因安全列表或网络安全组规则阻止流量,发往互联网网关的数据包被丢弃的数量。 |
总和 |
数量 |
|
发往 IGW 的数据包丢弃数 - 无路由 |
因路由表中未找到目标的有效路由,发往互联网网关的数据包被丢弃的数量。 |
总和 |
数量 |
|
发往 IGW 的数据包丢弃数 - 吞吐量 |
因超出吞吐量限制或带宽约束,发往互联网网关的数据包被丢弃的数量。 |
总和 |
数量 |
|
发往 IGW 的数据包丢弃数 - 其他 |
因其他杂项原因(不属于特定丢弃类别),发往互联网网关的数据包被丢弃的数量。 |
总和 |
数量 |
|
来自 IGW 的数据包丢弃数 - 安全规则 |
因安全列表或网络安全组规则阻止返回流量,来自互联网网关的数据包被丢弃的数量。 |
总和 |
数量 |
|
来自 IGW 的数据包丢弃数 - 无路由 |
因未找到源地址的有效返回路由,来自互联网网关的数据包被丢弃的数量。 |
总和 |
数量 |
|
来自 IGW 的数据包丢弃数 - 吞吐量 |
因返回路径上的吞吐量限制或带宽约束,来自互联网网关的数据包被丢弃的数量。 |
总和 |
数量 |
|
来自 IGW 的数据包丢弃数 - 其他 |
因其他杂项原因(不属于特定丢弃类别),来自互联网网关的数据包被丢弃的数量。 |
总和 |
数量 |
|
总字节数 |
表示互联网网关处理(发送与接收)的总字节数的聚合指标。对于了解整体流量规模至关重要。 |
总和 |
字节 |
|
总数据包数 |
互联网网关处理(发送与接收)的所有数据包数量的聚合统计。对于流量模式分析至关重要。 |
总和 |
数量 |
|
丢弃率 |
丢弃数据包与总处理数据包的比例(百分比)。反映互联网网关健康状况和效率的关键性能指标。数值超过 1–2% 通常表明基础设施或配置存在需要立即关注的问题。 |
平均值 |
百分比 |
阈值配置
要为互联网网关监视器配置阈值:
- 登录您的 Site24x7 账户,导航至管理 > 配置文件 > 阈值与可用性。
- 点击添加阈值配置文件。
- 从监视器类型下拉菜单中选择互联网网关,并在显示名称字段中提供合适的名称。
- 支持的指标显示在阈值配置部分,您可以为上述所有指标设置阈值。
- 点击保存。
许可证
- 每个互联网网关监视器消耗一个基础监视器许可证。
查看互联网网关数据
要监控您的互联网网关环境,请登录 Site24x7 账户,导航至云 > OCI > 互联网网关。
监视器数据
互联网网关监视器的监视器数据如下所示。
摘要
摘要标签页提供事件时间线和指标的全面概述,通过深度图表展示互联网网关监视器的性能状况。
配置
配置标签页汇总了互联网网关监视器的基本详情,包括创建时间、状态及其他配置详情。
Zia 预测
Zia 预测标签页显示基于历史时间序列数据的性能指标(资源使用量测量)预测图表,未来点位将在图表中呈现。系统利用 15 天的历史数据预测未来 7 天的指标使用情况。
中断
中断标签页提供中断的开始时间、结束时间、持续时间及备注(如有)等详情。
资产清单
从资产清单标签页中获取类型、区域、监视器许可证类别等详情。阈值与可用性配置文件和通知配置文件可根据用户需求进行设置,并在此标签页中查看。
日志报表
日志报表标签页提供互联网网关监视器日志状态的综合报表,可下载为 CSV 文件。
告警日志
告警日志标签页按时间顺序显示与互联网网关监视器相关的所有已触发告警列表。此标签页可帮助您追踪告警历史和严重程度,以评估问题并验证阈值设置。
