阿里云 Serverless 应用引擎(SAE)监控集成
Site24x7 为阿里云 Serverless 应用引擎(SAE)提供全栈可见性,帮助您监控容器化应用程序的资源消耗和基础设施行为。一旦将阿里云账户与 Site24x7 集成,所有关联的 SAE 实例将被自动发现并开始监控。
使用场景
- 性能诊断:监控各实例的 CPU 和内存使用情况,识别资源瓶颈。
- 磁盘和 I/O 监控:跟踪存储使用情况及磁盘读写活动,检测延迟或饱和问题。
- 网络流量和错误:通过监控流量量、数据包数量和传输错误,确保网络健康。
- TCP 连接分析:获取活跃、非活跃及总 TCP 连接的可见性,便于连接问题排除。
- 弹性扩展洞察:跟踪系统负载,优化无服务器容器的自动扩展策略。
设置与配置
- 登录您的 Site24x7 账户,导航至云 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面中,从服务类型列表中选择 Serverless 应用引擎。
- 添加完成后,前往云 > 阿里云 > Serverless 应用引擎,查看仪表板和性能指标。
支持的指标
CPU 指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Instance CPU Usage | 特定 SAE 实例的 CPU 使用率。 | 百分比 |
| Instance CPU User Usage | 实例中用户进程占用的 CPU 时间。 | 百分比 |
| Instance CPU System Usage | 实例中系统进程占用的 CPU 时间。 | 百分比 |
| CPU Usage | 所有实例的 CPU 使用率汇总。 | 百分比 |
| CPU User Usage | 所有实例中用户进程占用的 CPU 时间汇总。 | 百分比 |
| CPU System Usage | 所有实例中系统进程占用的 CPU 时间汇总。 | 百分比 |
内存指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Instance Memory Used | SAE 实例当前使用的内存量。 | MB |
| Instance Memory Usage Percentage | SAE 实例使用的内存占比。 | 百分比 |
| Instance Total Memory | 分配给实例的总内存量。 | MB |
| Memory Used | 所有实例使用的总内存量。 | MB |
| Memory Usage Percentage | 总体内存使用率百分比。 | 百分比 |
| Total Memory | 所有实例可用的总内存量。 | MB |
磁盘 I/O 与利用率
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Instance Disk Used | 实例使用的磁盘空间。 | MB |
| Instance Disk Usage Percentage | 实例使用的磁盘占比。 | 百分比 |
| Instance Total Disk | 实例可用的总磁盘空间。 | MB |
| Instance Disk Read | 从磁盘读取的总字节数。 | 字节 |
| Instance Disk Write | 写入磁盘的总字节数。 | 字节 |
| Instance Disk Read IOPS | 每秒读取操作次数。 | IOPS |
| Instance Disk Write IOPS | 每秒写入操作次数。 | IOPS |
网络流量与错误
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Instance Network Receive Bytes | 实例接收的总入站网络流量(接收字节数)。 | 字节 |
| Instance Network Transmit Bytes | 实例发送的总出站网络流量(传输字节数)。 | 字节 |
| Instance Network Receive Packets | 实例接收的入站数据包数。 | 次 |
| Instance Network Transmit Packets | 实例发送的出站数据包数。 | 次 |
| Instance Network Receive Error | 接收错误次数。 | 次 |
| Instance Network Transmit Error | 传输错误次数。 | 次 |
| Instance Network Receive Drop | 丢弃的入站数据包数。 | 次 |
TCP 连接
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Instance Active TCP Connections | 当前正在使用的活跃 TCP 连接数。 | 次 |
| Instance Inactive TCP Connections | 非活跃 TCP 连接数。 | 次 |
| Instance Total TCP Connections | TCP 连接总数。 | 次 |
| Instance TCP Time Wait Connections | 处于 TIME_WAIT 状态的 TCP 连接数。 | 次 |
负载指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Instance Load | 实例上的平均负载。 | 次 |
阈值配置
- 前往管理 > 配置文件 > 阈值与可用性。
- 为 Serverless 应用引擎创建或编辑阈值配置文件。
- 将配置文件分配给相应监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具有助于自动解决性能下降问题。当发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行映射的自动化操作。
- 前往管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射到监视器以实现主动解决。
配置规则
利用 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。在新增 Serverless 应用引擎监视器时,可自动应用这些设置。
