OCI Functions 监控
Oracle Cloud Infrastructure (OCI) Functions 是一个无服务器平台,让您无需管理基础设施即可运行代码。您可以将代码组织成应用程序,作为函数配置、网络和日志资源的容器。在 OCI Functions 中,您可以在应用程序内创建包含实际代码逻辑的函数。
概述
使用 Site24x7 监控 OCI Functions 可确保您的无服务器工作负载保持可靠性、成本效益,并与业务目标保持一致。若缺乏主动监控,函数逻辑中的错误、低效执行或配置错误的应用程序可能在影响用户之前无法被察觉。
Site24x7 提供对应用程序层和函数层的实时可见性,帮助快速发现故障、性能瓶颈和扩缩容问题。这种主动监控方式有助于最大程度缩短宕机时间、优化使用成本并持续提供稳定的服务质量。该集成提供以下两种监视器:
- OCI Application:跟踪 OCI Functions 应用程序的整体健康状况和配置,收集应用程序分区、网络详情及关联函数等元数据。
- OCI Functions:专注于在应用程序中运行的单个函数。Site24x7 采集关键指标,例如函数调用次数、函数响应数和函数错误响应数。这有助于隔离问题、衡量函数效率并优化执行成本。
使用场景
- 某电商网站使用 OCI Functions 生成发票、发送邮件确认并更新订单状态。运维团队通过在 Site24x7 中监控应用程序和函数,确保这些工作流程稳定运行,从而实现无缝的订单处理并提升客户信任度。
- 某物流公司在应用程序中部署了多个函数,用于管理库存更新、货运跟踪和通知。若应用程序的配置或 VCN 设置出现问题,内部的所有函数都可能失败。借助 Site24x7 集成的 OCI Application 监视器,团队能够迅速识别根因在应用程序层,从而节省大量手动排查时间。
- 某支付团队部署函数以处理在线交易。若突发的代码错误导致支付函数出现故障,Site24x7 集成的 OCI Functions 监视器将立即捕获错误数量的激增并发送告警。团队可以快速回滚或修复函数,从而缩短宕机时间,将对用户的影响降到最低。
Site24x7 OCI Functions 集成的优势
将 OCI Functions 与 Site24x7 集成,可获得以下优势:
- 错误检测:对执行趋势中的故障或异常进行告警。
- 成本优化:识别消耗过多时间或资源的低效函数。
- 依赖关系可见性:了解应用程序层面的问题如何影响多个函数。
- 主动监控:通过自动化阈值和告警机制提前发现问题。
设置与配置
- Site24x7 使用跨租户访问,通过 Site24x7 的租户用户监控您的资源。登录 Site24x7 帐户,创建特定策略以允许 Site24x7 查看您的资源,同时不影响您的安全配置。
- 在集成 OCI 监视器页面上,从待发现服务列表中选择 OCI Functions。
策略与权限
请确保关联的 OCI 策略包含以下声明:
- "read functions-family"
轮询频率
Site24x7 根据设定的轮询频率(从每分钟一次到每天一次)查询 OCI 服务级别 API,以收集 OCI Functions 监视器的指标。
支持的指标
OCI Application
OCI Application 监视器支持的指标如下所示。
| 指标名称 | 说明 | 统计方式 | 单位 |
|---|---|---|---|
| 总调用次数 | 应用程序内所有函数的调用总次数,提供应用程序级别的整体使用模式视图。 | 求和 | 次 |
| 同步调用次数 | 调用方等待响应的同步函数调用次数。 | 求和 | 次 |
| 分离式调用次数 | 独立执行、无需立即向调用方返回响应的异步函数调用次数。 | 求和 | 次 |
| 总响应次数 | 应用程序内所有函数生成的响应总次数,包括成功、错误和限流响应。 | 求和 | 次 |
| 错误响应次数 | 整个应用程序中导致错误的函数响应次数,是应用程序健康监控的关键指标。 | 求和 | 次 |
| 成功响应次数 | 应用程序内所有函数的成功响应次数,是衡量应用程序可靠性的关键指标。 | 求和 | 次 |
| 限流响应次数 | 因超出应用程序级别的并发限制或速率限制而被限流的响应次数。 | 求和 | 次 |
| 平均执行时长 | 应用程序内所有函数的平均执行时间,提供应用程序级别的性能概览。 | 平均值 | 毫秒 |
| 预置并发总量 | 应用程序内所有函数分配的预置并发总量。 | 平均值 | MB |
| 已分配总并发量 | 应用程序中已分配的总并发量。 | 平均值 | MB |
| 错误率 | 应用程序级别错误响应数与总响应数的百分比。这是整个应用程序的关键可靠性指标,超过 1-2% 通常需要进行调查。 | 平均值 | 百分比 |
| 成功率 | 应用程序级别成功响应数与总响应数的百分比,是反映应用程序整体健康状况的关键性能指标。 | 平均值 | 百分比 |
| 限流率 | 应用程序级别限流响应数与总响应数的百分比,是反映应用程序整体健康状况的关键性能指标。 | 平均值 | 百分比 |
OCI Functions
OCI Functions 监视器支持的指标如下所示。
| 指标名称 | 说明 | 统计方式 | 单位 |
|---|---|---|---|
| 函数调用次数 | 特定函数的调用总次数,包含同步和分离式调用。 | 求和 | 次 |
| 函数同步调用次数 | 特定函数的同步调用次数,调用方等待响应。 | 求和 | 次 |
| 函数分离式调用次数 | 特定函数独立执行的异步调用次数。 | 求和 | 次 |
| 函数响应次数 | 特定函数生成的响应总次数,包含所有响应类型。 | 求和 | 次 |
| 函数错误响应次数 | 特定函数的错误响应次数。 | 求和 | 次 |
| 函数成功响应次数 | 特定函数的成功响应次数,是衡量函数健康状况的关键指标。 | 求和 | 次 |
| 函数限流响应次数 | 特定函数因并发或速率限制而产生的限流响应次数。 | 求和 | 次 |
| 函数平均执行时长 | 特定函数的平均执行时间,是性能监控和优化的关键指标。 | 平均值 | 毫秒 |
| 函数最大执行时长 | 特定函数记录到的最大执行时间,用于识别性能峰值和异常值。 | 最大值 | 毫秒 |
| 函数错误率 | 特定函数错误响应数与总响应数的百分比,是关键的可靠性指标。 | 平均值 | 百分比 |
| 函数成功率 | 特定函数成功响应数与总响应数的百分比,是主要的健康状况指标。 | 平均值 | 百分比 |
| 已分配预置并发量 | 当前分配给特定函数的预置并发量,是性能和成本监控的重要指标。 | 平均值 | MB |
阈值配置
为 OCI Functions 监视器配置阈值:
- 登录 Site24x7 帐户,前往管理 > 配置文件 > 阈值和可用性。
- 点击添加阈值配置文件。
- 从监视器类型下拉菜单中选择适用的监视器,并在显示名称字段中填写合适的名称。可选项包括 OCI Applications 和 OCI Functions。
- 在阈值配置部分将显示支持的指标,您可以为上述所有指标设置阈值。
- 点击保存。
许可
- 每个 OCI Application 监视器使用一个基础监视器许可证。
- 每个 OCI Functions 监视器使用一个基础监视器许可证。
查看 OCI Functions 数据
要监控 OCI Functions 环境,请登录 Site24x7 帐户,前往云 > OCI > OCI Applications。
要查看 OCI Functions 监视器数据,请前往 OCI Applications > Functions 选项卡,点击 OCI Functions 监视器超链接。
监视器数据
OCI Application
OCI Application 监视器的数据如下所示。
摘要
摘要选项卡提供事件时间线和指标的全面概览,通过图表直观呈现 OCI Application 监视器的性能情况。
Functions
Functions 选项卡显示函数可用性详情以及与 OCI Application 监视器关联的 OCI Functions 监视器列表。点击所需的监视器名称超链接可查看 OCI Functions 监视器数据。
配置
配置选项卡汇总了 OCI Application 监视器的关键详情,包括其应用程序名称、区域、生命周期状态及其他配置详情。该选项卡还包含应用程序日志详情部分,仅当底层函数在过去 24 小时内被调用时才会显示相关详情;若该期间内无函数执行记录,则不显示日志详情。
Zia 预测
Zia 预测选项卡基于历史时间序列数据,显示性能指标(资源使用量度量)的预测图表及未来数据点。系统使用 30 天的历史数据预测未来 7 天的指标使用情况。
中断
中断选项卡提供中断事件的开始时间、结束时间、持续时长及备注(如有)等详情。
资产清单
从资产清单选项卡可获取区域、监视器许可类别等详细信息。阈值和可用性配置文件及通知配置文件可根据用户需求进行设置,并在此选项卡中查看。
日志报表
日志报表选项卡提供 OCI Application 监视器日志状态的汇总报表,可下载为 CSV 文件。
告警日志
告警日志选项卡按时间顺序显示与 Application 监视器相关的所有已触发告警列表。通过此选项卡可追踪告警历史和严重程度,以便评估问题并验证阈值设置。
OCI Functions
OCI Functions 监视器的数据如下所示。
摘要
摘要选项卡提供事件时间线和指标的全面概览,通过图表直观呈现 OCI Functions 监视器的性能情况。
近期日志
近期日志选项卡提供您所监控函数最新调用日志的实时视图,帮助您验证函数执行情况、调试错误并近实时分析性能趋势。
仅显示最近 24 小时内的日志,24 小时前的日志不在此视图中显示。这些日志通过 API 调用按需获取并展示,但 Site24x7 不会将其存储在数据库中。如需查看较早的日志,请在 OCI 控制台中查看。
配置
配置选项卡汇总了 OCI Functions 监视器的关键详情,包括其应用程序 OCID、区域及其他配置详情。
Zia 预测
Zia 预测选项卡基于历史时间序列数据,显示性能指标(资源使用量度量)的预测图表及未来数据点。系统使用 30 天的历史数据预测未来 7 天的指标使用情况。
中断
中断选项卡提供中断事件的开始时间、结束时间、持续时长及备注(如有)等详情。
资产清单
从资产清单选项卡可获取区域、监视器许可类别等详细信息。阈值和可用性配置文件及通知配置文件可根据用户需求进行设置,并在此选项卡中查看。
日志报表
日志报表选项卡提供 OCI Functions 监视器日志状态的汇总报表,可下载为 CSV 文件。
告警日志
告警日志选项卡按时间顺序显示与 OCI Functions 监视器相关的所有已触发告警列表。通过此选项卡可追踪告警历史和严重程度,以便评估问题并验证阈值设置。
相关文章
