如何监控 Akamai 云中的 LKE
Site24x7 实时监控您的 Akamai 云 Linode Kubernetes Engine(LKE)集群可用性,持续追踪状态和中断事件,使平台团队能够在工作负载和服务受到影响之前响应集群中断。
使用场景
集群健康状态:摘要选项卡实时显示每个 LKE 集群的状态和可用性,帮助平台和 DevOps 团队快速发现集群宕机并在工作负载受影响之前启动恢复。
宕机可见性:宕机次数和持续时长提供清晰的集群中断时间线,便于将问题与部署、基础设施变更或节点故障关联,从而识别根本原因。
SLA 保障:任意所选时间段内的可用性数据帮助团队评估集群正常运行时间是否符合可靠性要求,并为内部 SLA 追踪和性能审查提供清晰的洞察。
设置与配置
LKE 资源在 Akamai 集成期间会自动发现并受到监控。要启用监控,请按照以下步骤操作:
- 导航至云 > Akamai > 添加 Akamai 云监视器。按照步骤添加 Akamai 监视器。
- 在添加或编辑 Akamai 监视器时,从服务/资源类型下拉菜单中选择 LKE,然后点击保存。
- 转到云 > Akamai 云,选择已创建的 Akamai 监视器,然后点击 LKE。
注意
LKE 将在下一个发现周期中按照您在创建 Akamai 监视器时选择的发现频率进行发现。
数据采集频率
根据配置的轮询间隔,Akamai LKE 的性能指标将每五分钟采集一次,并默认每五分钟更新一次到 Site24x7 门户。
支持的指标
摘要
摘要选项卡追踪每个 LKE 集群的整体可用性状态以及宕机事件、宕机持续时长和 SLA 合规性,让您的团队一目了然地了解 Kubernetes 控制平面及相关服务是否正常运行且不存在中断。
对于运行生产容器化工作负载的团队而言,当集群无响应或进入降级状态时,这些可用性数据是首要的响应信号。
