腾讯云 EKS 监控集成
借助 Site24x7 腾讯云 EKS 监控集成,您可以:
- 监控无服务器 Kubernetes Pod 的 CPU 和内存资源可用性与消耗情况。
- 追踪 Pod 健康状态——包括总数、运行中、待调度及异常 Pod 数量。
- 在 Pod 调度失败和崩溃循环影响工作负载之前及时检测。
- 根据整个 EKS 环境中的资源使用趋势规划弹性容量。
本帮助文档包含设置腾讯云 EKS 监控集成的说明及相关信息。
配置与安装
在设置腾讯云监视器时,如果您已在"服务/资源"下拉菜单中选择了 EKS,则系统将自动发现并监控您的所有 EKS 资源,无需为每个资源手动创建监视器。
如果在创建腾讯云监视器时未选择 EKS,请按以下步骤操作:
- 登录您的 Site24x7 账户。
- 前往云服务 > 腾讯云,选择您的腾讯云监视器,然后在左侧窗格中打开任意仪表板。
- 单击汉堡图标
,选择编辑,进入编辑腾讯云监视器页面。 - 在编辑腾讯云监视器页面,从服务/资源下拉菜单中选择 EKS,然后单击保存。
- 配置成功后,前往云服务 > 腾讯云 > EKS,即可查看已发现的资源。
数据采集频率
腾讯云 EKS 资源的性能指标默认每五分钟采集一次,并每五分钟更新至 Site24x7 门户;指标也会根据所选的轮询间隔进行采集。
支持的指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| Total CPU Cores | EKS 集群中所有 Pod 分配的 CPU 核心总数 | Cores |
| Used CPU Cores | 所有 Pod 当前正在使用的 CPU 核心数 | Cores |
| Total Memory | EKS 集群中所有 Pod 分配的内存总量 | GB |
| Memory Usage | 集群中所有 Pod 当前消耗的内存量 | Bytes |
| Abnormal Pods | 处于失败、错误或崩溃循环状态的 Pod 数量 | Count |
| Pending Pods | 等待调度或等待资源就绪的 Pod 数量 | Count |
| Running Pods | 当前处于运行状态的 Pod 数量 | Count |
| Total Pods | EKS 集群中的 Pod 总数 | Count |
阈值配置
全局配置
- 在左侧导航栏中,进入管理部分。
- 在左侧窗格中选择配置文件,在下拉菜单中选择阈值和可用性 (+) 标签,然后单击右上角的添加阈值配置文件。
- 将监视器类型设置为腾讯云 EKS,即可为上述所有指标设置阈值。
监视器级配置
- 前往云服务 > 腾讯云 > EKS。
- 选择需要设置阈值的资源,单击汉堡图标
,选择编辑,进入编辑腾讯云 EKS 监视器页面。 - 通过选择阈值和可用性为各指标设置阈值,也可在属性级别配置 IT 自动化。
IT 自动化
Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。当发生阈值突破时,告警引擎将持续检查已定义阈值的系统事件,并执行相应的自动化操作。
配置规则
借助 Site24x7 的配置规则,您可以为多个监视器统一设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。
