Azure Batch Account 监控集成
Azure Batch 账户通常与存储账户关联。在单个 Batch 账户中,您可以运行多个 Batch 工作负载。您还可以将工作负载拆分到同一订阅下不同 Azure 区域的 Batch 账户中。
借助 Site24x7 的集成,您现在可以监控 Batch 账户、配置阈值,并接收关于严重问题的告警。
设置与配置
您可以在添加新监视器时添加 Azure Batch 账户,也可以将其添加到现有 Azure 监视器中。请按照以下步骤添加服务。
支持的指标
以下指标将被收集:
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| Dedicated Core Count | Batch 账户中专用核心的总数 | Total | Count |
| Creating Node Count | 正在创建的节点总数 | Total | Count |
| Idle Node Count | 空闲节点总数 | Total | Count |
| Job Delete Complete Events | 已成功删除的作业总数 | Total | Count |
| Job Delete Start Events | 已请求删除的作业总数 | Total | Count |
| Job Disable Complete Events | 已成功禁用的作业总数 | Total | Count |
| Job Disable Start Events | 已请求禁用的作业总数 | Total | Count |
| Job Start Events | 已成功启动的作业总数 | Total | Count |
| Job Terminate Complete Events | 已成功终止的作业总数 | Total | Count |
| Job Terminate Start Events | 已请求终止的作业总数 | Total | Count |
| Leaving Pool Node Count | 正在离开池的节点总数 | Total | Count |
| LowPriority Core Count | Batch 账户中低优先级核心的总数 | Total | Count |
| Offline Node Count | 离线节点总数 | Total | Count |
| Pool Create Events | 已创建的池总数 | Total | Count |
| Pool Delete Complete Events | 已完成删除的池总数 | Total | Count |
| Pool Delete Start Events | 已开始删除的池总数 | Total | Count |
| Pool Resize Complete Events | 已完成调整大小的池总数 | Total | Count |
| Pool Resize Start Events | 已开始调整大小的池总数 | Total | Count |
| Preempted Node Count | 被抢占的节点数量 | Total | Count |
| Rebooting Node Count | 正在重启的节点数量 | Total | Count |
| Reimaging Node Count | 正在重新映像的节点数量 | Total | Count |
| Running Node Count | 正在运行的节点数量 | Total | Count |
| Starting Node Count | 正在启动的节点数量 | Total | Count |
| Start Task Failed Node Count | 启动任务失败的节点数量 | Total | Count |
| Task Complete Events | 已完成的任务总数 | Total | Count |
| Task Fail Events | 以失败状态完成的任务总数 | Total | Count |
| Task Start Events | 已启动的任务总数 | Total | Count |
| Low-Priority Node Count | Batch 账户中低优先级节点的总数 | Total | Count |
| Dedicated Node Count | Batch 账户中专用节点的总数 | Total | Count |
| Unusable Node Count | 不可用节点的数量 | Total | Count |
| Waiting for Start Task Node Count | 正在等待启动任务完成的节点数量 | Total | Count |
阈值配置
全局配置
- 进入左侧导航栏中的管理部分。
- 在左侧面板中选择配置文件,然后从下拉菜单中选择阈值和可用性(+)选项卡。单击右上角的添加阈值配置文件。
- 将监视器类型设置为 Azure Batch Account。您现在可以为上述所有指标设置阈值。
监视器级别配置
- 进入云 > Azure,然后从下拉菜单中选择 Azure Batch Account。
- 选择要设置阈值的资源,然后单击汉堡图标
。选择编辑,系统将跳转到"编辑 Azure Batch Account 监视器"页面。 - 您可以通过选择阈值和可用性来设置指标的阈值。您也可以在属性级别配置 IT 自动化。
IT 自动化
Site24x7 提供一套专属 IT 自动化工具,可自动解决性能下降问题。这些工具会主动响应事件,而无需等待人工干预。
配置规则
借助 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数。
相关链接:
如何添加 Azure 监视器。
如何集成 Azure App Service 监视器。
如何集成 Azure 虚拟机监视器。
如何为监视器配置 IT 自动化。
如何添加配置规则。
