帮助手册

Azure 正常运行时间监控  

Site24x7 的 Azure 正常运行时间监控帮助您主动追踪 Azure 资源的可用性和正常运行时间,以及配置清单详情,确保在中断影响用户之前及时检测。借助 Site24x7 与 Azure Monitor 的集成,您可以降低运营开销,并在不牺牲可见性的前提下优化 Azure Monitor API 的使用。 

说明

Azure 正常运行时间监控将禁用性能指标数据采集。

主要优势   

  • 主动中断检测:即时检测并响应跨区域和资源组的资源宕机情况。

  • 优化 API 成本:Azure 正常运行时间监控仅使用极少量的 API 调用,帮助您节省 Azure Monitor 费用。

  • 轻量级监控:在不追踪完整性能指标的情况下监控可用性,非常适合注重成本的环境。

  • 无缝可见性: 通过预配置的仪表板,全面了解所有资源及其配置详情。

Azure 正常运行时间监控的工作原理

启用 Azure 正常运行时间监控后,Site24x7 将:

  • 使用 Azure 资源健康 API 调用,定期检查所选 Azure 资源的可用性状态。

  • 在事件时间轴中记录并展示中断事件。

  • 提供宕机时间、故障及严重事件的摘要。

说明

在仅正常运行时间模式下,性能指标采集默认处于禁用状态。这有助于减少 API 使用量及相关成本。

基于标签添加 Azure 正常运行时间监视器   

您可以通过资源标签来控制哪些 Azure 资源被指定为 Azure 正常运行时间监视器。这使您能够根据 Azure 中的标签策略动态纳入资源。

工作原理   

Site24x7 允许您配置基于标签的筛选器,以:

  • 将带有特定标签的 Azure 资源作为正常运行时间监视器纳入监控。

这对于大规模 Azure 环境尤为有用,因为并非所有资源都需要进行性能追踪。

 添加步骤 

  1. 前往 > Azure,导航至您的 Azure 监视器。

  2. 点击监视器名称旁边的汉堡菜单图标 blobid14 > 编辑

  3. 编辑 Azure 监视器页面,于高级配置下,向下滚动至正常运行时间监控配置部分。

  4.  根据标签将资源纳入为正常运行时间监视器下:

  • 选择条件匹配逻辑为 OR(或)还是 AND(且)。

  • 输入标签键(例如 subscription、env 或 project)。

  • 点击加号图标 ➕,将标签添加到筛选器中。

  1. 点击保存以应用更改。

示例:使用多个标签配置 Azure 正常运行时间监控   

您可以将 Site24x7 配置为仅对满足特定标签条件的 Azure 资源追踪正常运行时间。在本示例中,您将为符合以下标签的资源设置监控:

  • 自定义标签键 uptime_site24x7 设置为 true。

  • 资源属于 pm 团队(标签:team: pm)。

  • 资源位于 centralusukwest Azure 区域(标签:location: centralusukwest)。

配置步骤:  

  1. 前往 > Azure,点击您的 Azure 监视器上的编辑

  2. 展开高级配置部分。

  3. 正常运行时间监控配置下,选择 AND 以确保所有标签条件都必须匹配。

  4. 添加以下标签筛选器:

  • uptime_site24x7 = true

  • team = pm

  • location = centralus, ukwest

  1. 点击保存

只有满足全部三个条件的资源才会被设置为正常运行时间监视器。

使用此配置,可将 Azure 正常运行时间监控筛选到特定团队拥有、部署在指定区域的生产资源——非常适合减少不必要的 API 调用,提高监控的针对性。

这种标签方式可对需要监控正常运行时间的资源进行精细化管控,有助于降低噪音并优化监控成本。

筛选器的工作原理   

  1. 按照配置中定义的规则,应用包含标签筛选器。

  2. 同时匹配 Azure 资源筛选器正常运行时间监控配置筛选器的资源,将被添加为 Azure 正常运行时间监视器。

  3. 如果您未配置上述任何正常运行时间筛选器,则不会有任何资源被添加为 Azure 正常运行时间监视器。

  4. Site24x7 会自动生成某些标签,包括 uptime_site24x7、  resourceGroup 名称、locationserviceType订阅名称,这些标签也可用于动态发现或分组监视器。  

标签值区分大小写,必须完全匹配。

Azure 正常运行时间监控支持的监视器类型   

Site24x7 中的 Azure 正常运行时间监控支持以下 Azure 服务:

 查看 Azure 正常运行时间和中断情况   

正常运行时间摘要选项卡中,您可以:

  • 查看事件时间轴,以可视化方式呈现任何宕机、严重错误或维护时段。

  • 访问宕机故障严重历史记录,详细了解过去中断的时间和持续时长。

启用 Azure 性能监控   

要启用 Azure 性能数据采集:

  1. 登录您的 Site24x7 账户。

  2. 前往 > Azure,点击所需的 Azure 资源监视器。

  3. 导航至正常运行时间摘要选项卡。

  4. 如需启用性能指标数据采集并查看 CPU 和内存使用率的时序图表,请点击启用性能指标采集

  5. 启用后,Site24x7 将开始追踪性能指标并记录任何性能问题。

 优化监控成本   

Site24x7 将 Azure 正常运行时间监控的 Azure API 调用次数降至最低,从而显著降低监控成本:

  • API 成本降低示例:1000 次 API 调用约 $0.01

  • 非常适合在确保高正常运行时间的同时注重预算控制的团队

您可以从仅正常运行时间模式开始,根据需要再启用完整的指标采集功能。

 

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!