Azure 正常运行时间监控
Site24x7 的 Azure 正常运行时间监控帮助您主动追踪 Azure 资源的可用性和正常运行时间,以及配置清单详情,确保在中断影响用户之前及时检测。借助 Site24x7 与 Azure Monitor 的集成,您可以降低运营开销,并在不牺牲可见性的前提下优化 Azure Monitor API 的使用。
Azure 正常运行时间监控将禁用性能指标数据采集。
主要优势
-
主动中断检测:即时检测并响应跨区域和资源组的资源宕机情况。
-
优化 API 成本:Azure 正常运行时间监控仅使用极少量的 API 调用,帮助您节省 Azure Monitor 费用。
-
轻量级监控:在不追踪完整性能指标的情况下监控可用性,非常适合注重成本的环境。
-
无缝可见性: 通过预配置的仪表板,全面了解所有资源及其配置详情。
Azure 正常运行时间监控的工作原理
启用 Azure 正常运行时间监控后,Site24x7 将:
-
使用 Azure 资源健康 API 调用,定期检查所选 Azure 资源的可用性状态。
-
在事件时间轴中记录并展示中断事件。
-
提供宕机时间、故障及严重事件的摘要。
在仅正常运行时间模式下,性能指标采集默认处于禁用状态。这有助于减少 API 使用量及相关成本。
基于标签添加 Azure 正常运行时间监视器
您可以通过资源标签来控制哪些 Azure 资源被指定为 Azure 正常运行时间监视器。这使您能够根据 Azure 中的标签策略动态纳入资源。
工作原理
Site24x7 允许您配置基于标签的筛选器,以:
-
将带有特定标签的 Azure 资源作为正常运行时间监视器纳入监控。
这对于大规模 Azure 环境尤为有用,因为并非所有资源都需要进行性能追踪。
添加步骤
-
前往云 > Azure,导航至您的 Azure 监视器。
-
点击监视器名称旁边的汉堡菜单图标
> 编辑。
-
在编辑 Azure 监视器页面,于高级配置下,向下滚动至正常运行时间监控配置部分。
-
在 根据标签将资源纳入为正常运行时间监视器下:
-
选择条件匹配逻辑为 OR(或)还是 AND(且)。
-
输入标签键(例如 subscription、env 或 project)。
-
点击加号图标 ➕,将标签添加到筛选器中。
-
点击保存以应用更改。
示例:使用多个标签配置 Azure 正常运行时间监控
您可以将 Site24x7 配置为仅对满足特定标签条件的 Azure 资源追踪正常运行时间。在本示例中,您将为符合以下标签的资源设置监控:
-
自定义标签键 uptime_site24x7 设置为 true。
-
资源属于 pm 团队(标签:team: pm)。
-
资源位于 centralus 或 ukwest Azure 区域(标签:location: centralus 或 ukwest)。
配置步骤:
-
前往云 > Azure,点击您的 Azure 监视器上的编辑。
-
展开高级配置部分。
-
在正常运行时间监控配置下,选择 AND 以确保所有标签条件都必须匹配。
-
添加以下标签筛选器:
-
uptime_site24x7 = true
-
team = pm
-
location = centralus, ukwest
-
点击保存。
只有满足全部三个条件的资源才会被设置为正常运行时间监视器。
使用此配置,可将 Azure 正常运行时间监控筛选到特定团队拥有、部署在指定区域的生产资源——非常适合减少不必要的 API 调用,提高监控的针对性。
这种标签方式可对需要监控正常运行时间的资源进行精细化管控,有助于降低噪音并优化监控成本。
筛选器的工作原理
-
按照配置中定义的规则,应用包含标签筛选器。
-
同时匹配 Azure 资源筛选器和正常运行时间监控配置筛选器的资源,将被添加为 Azure 正常运行时间监视器。
-
如果您未配置上述任何正常运行时间筛选器,则不会有任何资源被添加为 Azure 正常运行时间监视器。
-
Site24x7 会自动生成某些标签,包括 uptime_site24x7、 resourceGroup 名称、location、serviceType 和订阅名称,这些标签也可用于动态发现或分组监视器。
标签值区分大小写,必须完全匹配。
Azure 正常运行时间监控支持的监视器类型
Site24x7 中的 Azure 正常运行时间监控支持以下 Azure 服务:
查看 Azure 正常运行时间和中断情况
在正常运行时间摘要选项卡中,您可以:
-
查看事件时间轴,以可视化方式呈现任何宕机、严重错误或维护时段。
-
访问宕机、故障或严重历史记录,详细了解过去中断的时间和持续时长。
启用 Azure 性能监控
要启用 Azure 性能数据采集:
-
登录您的 Site24x7 账户。
-
前往云 > Azure,点击所需的 Azure 资源监视器。
-
导航至正常运行时间摘要选项卡。
-
如需启用性能指标数据采集并查看 CPU 和内存使用率的时序图表,请点击启用性能指标采集。
-
启用后,Site24x7 将开始追踪性能指标并记录任何性能问题。
优化监控成本
Site24x7 将 Azure 正常运行时间监控的 Azure API 调用次数降至最低,从而显著降低监控成本:
-
API 成本降低示例:1000 次 API 调用约 $0.01
-
非常适合在确保高正常运行时间的同时注重预算控制的团队
您可以从仅正常运行时间模式开始,根据需要再启用完整的指标采集功能。
