如何监控 DigitalOcean 中的 App Platform
Site24x7 持续监控您的 DigitalOcean App Platform 指标,为您的团队提供 CPU 使用率、内存使用率和容器重启活动的实时可见性。这些指标对于维护稳定性和效率至关重要。
通过同步观测这些指标,您可以及早发现性能降级,在影响用户体验或演变为高代价中断之前主动修复问题。
使用场景
资源稳定性:通过追踪 CPU 和内存使用情况防止限流或崩溃,在达到性能极限之前进行扩容。
崩溃检测:通过监控重启次数及早识别不稳定情况,在影响应用程序可用性之前检测崩溃循环。
成本优化:通过分析 CPU 和内存趋势合理配置资源,避免过度分配或产生性能风险。
设置与配置
App Platform 资源在 DigitalOcean 集成期间将自动被发现并受到监控。要启用监控,请按照以下步骤操作:
- 导航至云 > DigitalOcean > 添加 DigitalOcean 监视器,按照步骤添加 DigitalOcean 监视器。
- 在添加或编辑 DigitalOcean 监视器时,从服务/资源类型下拉菜单中选择 App Platform,然后单击保存。
- 转到云 > DigitalOcean,选择已创建的 DigitalOcean 监视器,然后单击 App Platform。
注意
App Platform 将在下次发现周期中根据创建 DigitalOcean 监视器时所选的频率进行发现。
数据采集频率
根据所选的轮询间隔,DigitalOcean App Platform 的性能指标将每两分钟采集一次,默认情况下每五分钟更新到 Site24x7 门户。
支持的指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Restart Count | 在监控间隔内应用程序容器的重启次数。 | 次数 |
| CPU Percentage | App 组件使用的已分配 vCPU 百分比。 | 百分比 |
| Memory Percentage | App 组件使用的已分配内存百分比。 | 百分比 |
阈值配置
您可以为所有 App Platform 指标配置阈值和告警,以主动检测性能降级或连接问题。
- 转到管理 > 配置文件 > 阈值与可用性。
- 为 App Platform 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
使用 Site24x7 的 IT 自动化功能解决 App Platform 性能常见问题:
- 转到管理 > IT 自动化模板,然后单击添加自动化模板。
- 通过选择自动化类型(如服务器重启、清空队列)创建自动化规则。
- 将创建的规则映射到 App Platform,以便在告警触发时自动执行。
配置规则
使用配置规则简化跨 App Platform 实例的批量设置。在发现新监视器时,自动分配阈值配置文件、通知配置文件、标签和监视器组。
