帮助手册

Azure Kubernetes Service 监控集成

Azure Kubernetes Service 是一项开源、全托管的容器编排服务,支持按需进行资源配置、扩缩容和升级,且不会造成 Kubernetes 集群宕机。它简化了公有云上托管 Kubernetes 集群的部署,并提供对托管 Kubernetes 服务的健康监控。

借助 Site24x7 的集成,您现在可以监控 Azure Kubernetes Service、配置阈值,并接收关于严重问题的告警。

设置与配置

您可以在添加新 Azure 监视器时添加 Azure Kubernetes Service,也可以按照以下步骤将其添加到现有 Azure 监视器中。

支持的指标

指标名称 描述 统计方式 单位
Available CPU Cores 托管集群中可用 CPU 核心的总数 Average Count
Available Memory 托管集群中可用内存的总量 Average Bytes
Nodes in Ready State 处于就绪状态的节点数量 Average Count
Running Pods 处于运行状态的 Pod 数量 Average Count
Pods in Ready State 处于就绪状态的 Pod 数量 Average Count
Inflight Requests 在过去一秒内,API 服务器上每种请求类型当前使用的最大 Inflight 请求数 Average Count
Cluster Health 显示集群自动扩缩器是否会对集群采取操作 Average Count
Scale Down Cooldown 显示缩容是否处于冷却阶段(此阶段不会移除节点) Average Count
Unneeded Nodes 集群自动扩缩器标记的、将在指定时间后被删除的节点数量 Average Count
Unschedulable Pods 集群中当前无法调度的 Pod 数量 Average Count
Statuses for various Node Conditions 不同节点条件的状态 Average Count
Number of Pods by Phase 处于特定阶段的 Pod 数量 Average Count
CPU Usage Millicores 集群的 CPU 总利用率 Average Millicores
CPU Usage Percentage 集群的平均 CPU 利用率 Average Percentage
Memory RSS Bytes 容器 RSS 内存使用量(以字节为单位) Average Bytes
Memory RSS Percentage 容器 RSS 内存使用率(以百分比表示) Average Percentage
Memory Working Set Bytes 容器工作集内存使用量(以字节为单位) Average Bytes
Memory Working Set Percentage 容器工作集内存使用率(以百分比表示) Average Percentage
Disk Used Bytes 特定设备类型的磁盘空间使用量(以字节为单位) Average Bytes
Disk Used Percentage 特定设备类型的磁盘空间使用率(以百分比表示) Average Percentage
Network In Bytes 接收的网络数据量(以字节为单位) Average Bytes
Network Out Bytes 发送的网络数据量(以字节为单位) Average Bytes

Azure 正常运行时间监控

Site24x7 的 Azure 正常运行时间监控可主动跟踪 Azure 资源的可用性和正常运行时间,以及其配置和资源清单详情。请注意,启用正常运行时间监控将禁用性能指标数据采集。

阈值配置

全局配置

  1. 登录您的 Site24x7 账户。
  2. 在左侧导航栏中进入管理部分。
  3. 在左侧面板中选择配置文件,然后从下拉菜单中单击阈值和可用性(+)
  4. 单击右上角的添加阈值配置文件
  5. 从"监视器类型"下拉菜单中选择 Azure Kubernetes Service

您现在可以为上述所有指标设置阈值。

监视器级别配置

  1. 登录您的 Site24x7 账户。
  2. 进入 > Azure,然后从下拉菜单中选择 Azure Kubernetes Service
  3. 将鼠标悬停在要设置阈值的资源上,然后单击其旁边的汉堡图标
  4. 单击编辑,系统将跳转到"编辑 Azure Kubernetes Service 监视器"页面。
  5. 您可以通过选择阈值和可用性来设置指标的阈值。
    注意

    在某个配置文件中更改阈值指标,将影响与该阈值和可用性配置文件关联的所有资源的阈值指标。

您也可以在属性级别配置 IT 自动化

IT 自动化

Site24x7 提供一套专属 IT 自动化工具,可自动解决性能下降问题。这些工具会主动响应事件,而无需等待人工干预。

如何为监视器配置 IT 自动化

配置规则

借助 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数。

如何添加配置规则

相关链接:

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!