帮助手册

Azure Batch Account 监控集成

Azure Batch 账户通常与存储账户关联。在单个 Batch 账户中,您可以运行多个 Batch 工作负载。您还可以将工作负载拆分到同一订阅下不同 Azure 区域的 Batch 账户中。

借助 Site24x7 的集成,您现在可以监控 Batch 账户、配置阈值,并接收关于严重问题的告警。

设置与配置

您可以在添加新监视器时添加 Azure Batch 账户,也可以将其添加到现有 Azure 监视器中。请按照以下步骤添加服务

支持的指标

以下指标将被收集:

指标名称描述统计方式单位
Dedicated Core Count Batch 账户中专用核心的总数 Total Count
Creating Node Count 正在创建的节点总数 Total Count
Idle Node Count 空闲节点总数 Total Count
Job Delete Complete Events 已成功删除的作业总数 Total Count
Job Delete Start Events 已请求删除的作业总数 Total Count
Job Disable Complete Events 已成功禁用的作业总数 Total Count
Job Disable Start Events 已请求禁用的作业总数 Total Count
Job Start Events 已成功启动的作业总数 Total Count
Job Terminate Complete Events 已成功终止的作业总数 Total Count
Job Terminate Start Events 已请求终止的作业总数 Total Count
Leaving Pool Node Count 正在离开池的节点总数 Total Count
LowPriority Core Count Batch 账户中低优先级核心的总数 Total Count
Offline Node Count 离线节点总数 Total Count
Pool Create Events 已创建的池总数 Total Count
Pool Delete Complete Events 已完成删除的池总数 Total Count
Pool Delete Start Events 已开始删除的池总数 Total Count
Pool Resize Complete Events 已完成调整大小的池总数 Total Count
Pool Resize Start Events 已开始调整大小的池总数 Total Count
Preempted Node Count 被抢占的节点数量 Total Count
Rebooting Node Count 正在重启的节点数量 Total Count
Reimaging Node Count 正在重新映像的节点数量 Total Count
Running Node Count 正在运行的节点数量 Total Count
Starting Node Count 正在启动的节点数量 Total Count
Start Task Failed Node Count 启动任务失败的节点数量 Total Count
Task Complete Events 已完成的任务总数 Total Count
Task Fail Events 以失败状态完成的任务总数 Total Count
Task Start Events 已启动的任务总数 Total Count
Low-Priority Node Count Batch 账户中低优先级节点的总数 Total Count
Dedicated Node Count Batch 账户中专用节点的总数 Total Count
Unusable Node Count 不可用节点的数量 Total Count
Waiting for Start Task Node Count 正在等待启动任务完成的节点数量 Total Count

阈值配置

全局配置

  1. 进入左侧导航栏中的管理部分。
  2. 在左侧面板中选择配置文件,然后从下拉菜单中选择阈值和可用性(+)选项卡。单击右上角的添加阈值配置文件
  3. 将监视器类型设置为 Azure Batch Account。您现在可以为上述所有指标设置阈值。

监视器级别配置

  1. 进入云 > Azure,然后从下拉菜单中选择 Azure Batch Account
  2. 选择要设置阈值的资源,然后单击汉堡图标 。选择编辑,系统将跳转到"编辑 Azure Batch Account 监视器"页面。
  3. 您可以通过选择阈值和可用性来设置指标的阈值。您也可以在属性级别配置 IT 自动化

IT 自动化

Site24x7 提供一套专属 IT 自动化工具,可自动解决性能下降问题。这些工具会主动响应事件,而无需等待人工干预。

如何为监视器配置 IT 自动化

配置规则

借助 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数。

如何添加配置规则

相关链接:

如何添加 Azure 监视器。
如何集成 Azure App Service 监视器。
如何集成 Azure 虚拟机监视器。
如何为监视器配置 IT 自动化。
如何添加配置规则。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!