如何在华为云中监控 FunctionGraph
Site24x7 为您的华为云 FunctionGraph 环境带来深度可观测性,让您的团队实时掌握调用吞吐量、错误率和限流率、并发实例扩展、执行延迟以及资源消耗情况。这确保您的无服务器工作负载保持快速、高效且始终可用。
使用场景
错误分类:将错误计数细分为系统错误计数和函数错误计数,以区分基础架构故障和代码问题。
限流预防:限流计数表示并发执行限制已被突破,导致请求被拒绝。与并发数和实例使用率一起跟踪,在限流级联影响依赖服务之前提高限制或预留实例。
延迟保护:平均时长会掩盖尾部延迟问题。跟踪P95 时长和 P99.9 以及最大时长,以便在异常调用违反延迟 SLO 并影响面向用户的响应时间之前提前发现。
设置与配置
FunctionGraph 资源在华为云集成期间自动发现和监控。要启用监控,请按以下步骤操作:
- 导航至云 > Huawei > 添加华为云监视器。按照步骤添加华为云监视器。
- 在添加或编辑华为云监视器时,从服务/资源类型下拉菜单中选择 Function Graph,然后点击保存。
- 导航至云 > Huawei,选择已创建的华为云监视器,然后点击 FunctionGraph。
支持的指标
调用
指标名称 | 描述 | 单位 |
| Invocation Count | 监控期内函数被调用的总次数。 | Count |
| Error Count | 所有错误类型的失败调用总次数。 | Count |
| Error Rate | 导致错误的函数调用百分比。 | Percentage |
| Throttle Count | 由于超过并发执行限制而被拒绝的调用请求数量。 | Count |
| Concurrency | 在某一时间点并发执行的函数请求数量。 | Count |
| System Error Count | 由基础架构或平台级别错误导致的调用失败数量。 | Count |
| Function Error Count | 由函数代码本身错误导致的调用失败数量。 | Count |
实例
指标名称 | 描述 | 单位 |
| Reserved Instances | 分配给函数以消除冷启动的预置实例数量。 | Count |
| Pay Per Use Instances | 当前正在运行并按调用计费的按需实例数量。 | Count |
| Running Instances | 当前处于活动状态并处理请求的函数实例总数。 | Count |
| Instance Usage | 当前正在使用的可用函数实例百分比。 | Percentage |
延迟
指标名称 | 描述 | 单位 |
| Average Duration | 监控期内函数调用的平均执行时间。 | Millisecond |
| Maximum Duration | 单次函数调用记录的最长执行时间。 | Millisecond |
| Minimum Duration | 单次函数调用记录的最短执行时间。 | Millisecond |
| Duration P50 | 50% 函数调用完成时的执行时间。 | Millisecond |
| Duration P80 | 80% 函数调用完成时的执行时间。 | Millisecond |
| Duration P95 | 95% 函数调用完成时的执行时间。 | Millisecond |
| Duration P99 | 99% 函数调用完成时的执行时间。 | Millisecond |
| Duration P99.9 | 99.9% 函数调用完成时的执行时间。 | Millisecond |
资源
指标名称 | 描述 | 单位 |
| Memory Used | 每次函数调用消耗的平均内存量。 | MB |
| Function Cost | 函数的计算资源消耗,以 MB-秒为单位表示。 | MB |
阈值配置
您可以为所有 FunctionGraph 指标配置阈值和告警,以主动检测性能下降或连接问题。
- 前往 Admin > Configuration Profiles > Threshold and Availability。
- 为 Function Graph 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
使用 Site24x7 的 IT 自动化解决 FunctionGraph 性能的常见问题:
- 前往 Admin >IT Automation Templates。然后,点击添加自动化模板。
- 通过选择自动化类型(例如服务器重启、清空队列)创建自动化规则。
- 将创建的规则映射到 FunctionGraph,以便在告警期间自动执行。
配置规则
使用配置规则简化跨 FunctionGraph 实例的批量设置。当发现新监视器时,自动分配阈值配置文件、通知配置文件、标签和监视器组。
