帮助手册

腾讯云 EKS 监控集成

借助 Site24x7 腾讯云 EKS 监控集成,您可以:

  • 监控无服务器 Kubernetes Pod 的 CPU 和内存资源可用性与消耗情况。
  • 追踪 Pod 健康状态——包括总数、运行中、待调度及异常 Pod 数量。
  • 在 Pod 调度失败和崩溃循环影响工作负载之前及时检测。
  • 根据整个 EKS 环境中的资源使用趋势规划弹性容量。

本帮助文档包含设置腾讯云 EKS 监控集成的说明及相关信息。

配置与安装

在设置腾讯云监视器时,如果您已在"服务/资源"下拉菜单中选择了 EKS,则系统将自动发现并监控您的所有 EKS 资源,无需为每个资源手动创建监视器。

如果在创建腾讯云监视器时未选择 EKS,请按以下步骤操作:

  • 登录您的 Site24x7 账户
  • 前往云服务 > 腾讯云,选择您的腾讯云监视器,然后在左侧窗格中打开任意仪表板。
  • 单击汉堡图标 ,选择编辑,进入编辑腾讯云监视器页面。
  • 编辑腾讯云监视器页面,从服务/资源下拉菜单中选择 EKS,然后单击保存
  • 配置成功后,前往云服务 > 腾讯云 > EKS,即可查看已发现的资源。

数据采集频率

腾讯云 EKS 资源的性能指标默认每五分钟采集一次,并每五分钟更新至 Site24x7 门户;指标也会根据所选的轮询间隔进行采集。

支持的指标

指标名称描述单位
Total CPU Cores EKS 集群中所有 Pod 分配的 CPU 核心总数 Cores
Used CPU Cores 所有 Pod 当前正在使用的 CPU 核心数 Cores
Total Memory EKS 集群中所有 Pod 分配的内存总量 GB
Memory Usage 集群中所有 Pod 当前消耗的内存量 Bytes
Abnormal Pods 处于失败、错误或崩溃循环状态的 Pod 数量 Count
Pending Pods 等待调度或等待资源就绪的 Pod 数量 Count
Running Pods 当前处于运行状态的 Pod 数量 Count
Total Pods EKS 集群中的 Pod 总数 Count

阈值配置

全局配置

  • 在左侧导航栏中,进入管理部分。
  • 在左侧窗格中选择配置文件,在下拉菜单中选择阈值和可用性 (+) 标签,然后单击右上角的添加阈值配置文件
  • 将监视器类型设置为腾讯云 EKS,即可为上述所有指标设置阈值。

监视器级配置

  • 前往云服务 > 腾讯云 > EKS
  • 选择需要设置阈值的资源,单击汉堡图标 ,选择编辑,进入编辑腾讯云 EKS 监视器页面。
  • 通过选择阈值和可用性为各指标设置阈值,也可在属性级别配置 IT 自动化

IT 自动化

Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。当发生阈值突破时,告警引擎将持续检查已定义阈值的系统事件,并执行相应的自动化操作。

如何为监视器配置 IT 自动化

配置规则

借助 Site24x7 的配置规则,您可以为多个监视器统一设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。

如何添加配置规则

相关链接:

如何添加腾讯云监视器。
受监控的腾讯云服务类型列表。
如何为监视器配置 IT 自动化。
如何添加配置规则。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!