Azure Kubernetes Service 监控集成
Azure Kubernetes Service 是一项开源、全托管的容器编排服务,支持按需进行资源配置、扩缩容和升级,且不会造成 Kubernetes 集群宕机。它简化了公有云上托管 Kubernetes 集群的部署,并提供对托管 Kubernetes 服务的健康监控。
借助 Site24x7 的集成,您现在可以监控 Azure Kubernetes Service、配置阈值,并接收关于严重问题的告警。
设置与配置
您可以在添加新 Azure 监视器时添加 Azure Kubernetes Service,也可以按照以下步骤将其添加到现有 Azure 监视器中。
支持的指标
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| Available CPU Cores | 托管集群中可用 CPU 核心的总数 | Average | Count |
| Available Memory | 托管集群中可用内存的总量 | Average | Bytes |
| Nodes in Ready State | 处于就绪状态的节点数量 | Average | Count |
| Running Pods | 处于运行状态的 Pod 数量 | Average | Count |
| Pods in Ready State | 处于就绪状态的 Pod 数量 | Average | Count |
| Inflight Requests | 在过去一秒内,API 服务器上每种请求类型当前使用的最大 Inflight 请求数 | Average | Count |
| Cluster Health | 显示集群自动扩缩器是否会对集群采取操作 | Average | Count |
| Scale Down Cooldown | 显示缩容是否处于冷却阶段(此阶段不会移除节点) | Average | Count |
| Unneeded Nodes | 集群自动扩缩器标记的、将在指定时间后被删除的节点数量 | Average | Count |
| Unschedulable Pods | 集群中当前无法调度的 Pod 数量 | Average | Count |
| Statuses for various Node Conditions | 不同节点条件的状态 | Average | Count |
| Number of Pods by Phase | 处于特定阶段的 Pod 数量 | Average | Count |
| CPU Usage Millicores | 集群的 CPU 总利用率 | Average | Millicores |
| CPU Usage Percentage | 集群的平均 CPU 利用率 | Average | Percentage |
| Memory RSS Bytes | 容器 RSS 内存使用量(以字节为单位) | Average | Bytes |
| Memory RSS Percentage | 容器 RSS 内存使用率(以百分比表示) | Average | Percentage |
| Memory Working Set Bytes | 容器工作集内存使用量(以字节为单位) | Average | Bytes |
| Memory Working Set Percentage | 容器工作集内存使用率(以百分比表示) | Average | Percentage |
| Disk Used Bytes | 特定设备类型的磁盘空间使用量(以字节为单位) | Average | Bytes |
| Disk Used Percentage | 特定设备类型的磁盘空间使用率(以百分比表示) | Average | Percentage |
| Network In Bytes | 接收的网络数据量(以字节为单位) | Average | Bytes |
| Network Out Bytes | 发送的网络数据量(以字节为单位) | Average | Bytes |
Azure 正常运行时间监控
Site24x7 的 Azure 正常运行时间监控可主动跟踪 Azure 资源的可用性和正常运行时间,以及其配置和资源清单详情。请注意,启用正常运行时间监控将禁用性能指标数据采集。
阈值配置
全局配置
- 登录您的 Site24x7 账户。
- 在左侧导航栏中进入管理部分。
- 在左侧面板中选择配置文件,然后从下拉菜单中单击阈值和可用性(+)。
- 单击右上角的添加阈值配置文件。
- 从"监视器类型"下拉菜单中选择 Azure Kubernetes Service。
您现在可以为上述所有指标设置阈值。
监视器级别配置
- 登录您的 Site24x7 账户。
- 进入云 > Azure,然后从下拉菜单中选择 Azure Kubernetes Service。
- 将鼠标悬停在要设置阈值的资源上,然后单击其旁边的汉堡图标
。 - 单击编辑,系统将跳转到"编辑 Azure Kubernetes Service 监视器"页面。
- 您可以通过选择阈值和可用性来设置指标的阈值。
注意
在某个配置文件中更改阈值指标,将影响与该阈值和可用性配置文件关联的所有资源的阈值指标。
您也可以在属性级别配置 IT 自动化。
IT 自动化
Site24x7 提供一套专属 IT 自动化工具,可自动解决性能下降问题。这些工具会主动响应事件,而无需等待人工干预。
配置规则
借助 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数。
