帮助手册

Azure 监控 

Site24x7 的 Azure 监控 支持您发现并监控 Azure 资源,并深入了解对 Azure 环境健康运行至关重要的关键性能指标。

目前,我们支持监控 100+ 种服务类型,每种服务类型均配有专属指标,帮助您深入分析资源。 

通过在特定指标或阈值被突破时设置告警,及时获知 Azure 资源中的潜在问题或异常,并自动执行补救操作。

前提条件:

请使用以下三种方法之一对 Site24x7 进行身份验证,以监控您的 Azure 资源。

完成以上步骤后,即可继续添加 Azure 监视器。

添加监视器

  1. 登录您的 Site24x7 账户。
  2. 依次点击 云服务 > Azure > 添加 Azure 监视器。或者,点击左侧导航栏中的 管理,然后在云监控下点击 Azure
  3. 将从前提条件步骤中获取的 租户 ID客户端 ID客户端密钥值粘贴到相应字段中。
  4. 点击 开始资源发现

 

 

成功授权后,您将被重定向到 Site24x7 控制台以添加监视器。

 

添加 Azure 监视器页面中:

  1. 填写 显示名称以便识别。
  2. 设置客户端密钥过期日期
  3. 将监视器关联到现有或新的监视器组
  4. 添加 Azure 监视器页面中:
    • 从已发现的 Azure 订阅列表中,在订阅下拉菜单中选择要监控的订阅。
    • 自动添加新订阅进行监控切换为 ,以自动发现并添加新订阅进行监控。
    • 资源组下拉菜单中选择要监控的资源组。
    • 自动添加新资源组进行监控切换为 ,以自动发现并添加新资源组进行监控。
    • 服务/资源类型下拉菜单中选择要监控的 Azure 服务类型。
      • 默认情况下,Azure 账户中的所有订阅、资源组及受支持的服务类型均会被选中进行监控。
    • 按标签包含 Azure 资源:根据偏好在 ORAND 之间切换。输入 和相应的值,以匹配要包含监控的资源。点击 标签旁的 + 图标可添加多个标签。

      此选项将从 Azure 账户中包含匹配的资源并添加进行监控。 

    • 按标签排除 Azure 资源:根据偏好在 ORAND 之间切换。输入 和相应的值,以匹配要从监控中排除的资源。点击 标签旁的 + 图标可添加多个标签。

      此选项将从 Azure 账户中排除匹配的资源并将其从监控中移除。 

    • 将 自动发现新资源切换为 启用,以在下次发现周期中自动发现并监控任何新资源。
      • 如果用户从 Site24x7 手动触发自动发现,则无论此处设置如何,新资源都将被发现。
  5. 高级配置部分中进行相关更改。
  6. 为每种受支持的服务配置默认阈值配置文件:选择要分配阈值配置文件的服务类型。 
  7. 在 资源终止设置下:
    • 切换为 静音资源终止告警,如果您不想在已终止资源从 Site24x7 自动暂停或删除时收到告警。
    • 切换为 监控已终止的资源,确保对已终止资源的监控继续进行。该监视器将被标记为宕机,轮询将持续直到手动暂停。
    • 切换为 自动从监控中移除已终止的资源。您还可以定义一个特定的时间段(天数),以确定已终止资源在从 Site24x7 网页控制台中永久删除之前的保留时长。
      • 如果此字段设置为 :受监控资源将转为已删除状态
      • 如果此字段设置为 :受监控资源将在规定的时间段内转为已暂停状态。
  8. 配置 Azure 活动日志收集:
    活动日志收集配置下,启用 活动日志收集,设置日志收集间隔,并选择要收集的日志类别
  9. 选择现有的 通知配置文件用户组Site24x7 标签或新建。这些设置将应用于下次发现中添加的资源,并同时应用于所有关联的资源监视器。对于每个资源,将创建一个包含资源组、位置、订阅和资源类型的 Site24x7 Azure 标签。您还可以将 Site24x7 告警与您偏好的 第三方服务集成。
    标签格式如下:
    subscription: {subscription_name}
    resourceGroup : {resourcegroup_name}
    location: {location}
    serviceType: {monitortype}
  10. 在高级设置下,如果 自动创建监视器组设置为 并提供了标签键和值/值正则表达式,则系统将自动创建一个监视器组,并为每个标签键值对创建对应的子组。
  11. 点击 发现 Azure 资源开始监控。
注意

发现所有 Azure 资源最多需要 30 分钟。

Site24x7 监控的服务列表

监控 100+ 种 Azure 资源,包括虚拟机、规模集、存储账户、IoT Hub 和 Cosmos DB。

仪表板

Azure 监视器成功创建后,您将被引导至订阅页面。

您的所有 Azure 资源将在几分钟内添加到 Site24x7 用户控制台。

除此订阅仪表板外,还有三个专属仪表板。您还可以创建自定义仪表板、执行管理操作以及检测关键异常。

注意
同一 Azure 租户下的多个订阅可以添加到 Site24x7 用户控制台中的单个或多个 Azure 监视器。若要在同一租户中添加更多订阅进行监控,请转到编辑 Azure 监视器页面(Azure > 基础设施/库存仪表板/管理操作 > 悬停在 汉堡 图标 > 编辑),然后选择订阅。

自定义 Azure 监视器

通过高级配置定制您的 Azure 监视器,以最大可见性管理您的资源。

Azure 正常运行时间监控

Site24x7 的 Azure 正常运行时间监控支持主动跟踪 Azure 资源的可用性和正常运行时间,以及其配置和库存详情。 

服务配额监控

Site24x7 的 Azure 服务配额监控支持您主动监控配额使用情况、根据阈值设置告警,并防止意外的服务限制。通过监控存储、计算、网络和其他重要资源类别的配额,您可以确保云操作顺畅运行并有效规划容量。

服务配额

日志

活动日志

 

 

您在 Azure 门户中执行的每一个操作都会被记录为日志条目。日志将按用户设定的时间间隔进行收集,并显示在活动日志页面上。

查看日志列表:

  1. 转到 Azure > 点击 Azure 监视器 > 活动日志
    注意
    如果您未与 Site24x7 AppLogs 集成,则活动日志标签页将不可见。要开始收集日志,请转到 管理 > AppLogs > 设置 > 为"使用 AppLogs 从服务器收集应用程序日志"选项选择
  2. 输入查询内容并点击 搜索图标,在日志中进行搜索。
  3. 选择时间范围,查看特定时段的日志。

资源日志

所有 Azure 资源的资源日志将通过诊断设置进行收集。借助这些日志,您可以监控在 Azure 资源中执行的操作。

启用此集成后,Site24x7 将在资源所在位置创建一个名为 Site24x7Applogs-<location> 的唯一资源组,其中包含 存储账户Event GridFunction App 等新资源。使用这些新创建的资源,将实时收集该位置所有资源的日志。了解更多关于 如何从 Azure 收集日志 的信息。

要启用此功能,请转到 Azure 应用服务监视器,点击 资源日志,再点击 启用资源日志收集,并选择要监控的日志类别。在下次数据收集时,请求的日志将被收集。

注意

目前,此功能仅支持 Azure 应用服务。

资源依赖关系

大多数 Azure 资源为了正常持续运行,都依赖于其他资源或被其他资源所依赖。此页面列出了所有已发现的资源及其所依赖的资源,同时显示其状态(原因)、服务类型和位置。列出依赖资源有助于找出上级资源宕机的原因。

批量操作

使用批量操作,根据订阅、资源组、类型或位置对多个 Azure 资源监视器进行筛选并批量应用更改。

监视器组

  1. 转到 云服务 > Azure,点击 Azure 监视器。点击左侧面板中列出的任意服务类型,然后选择所需的资源监视器。
  2. 将鼠标悬停在显示名称旁边的 汉堡图标 上,然后点击 编辑

编辑 Azure 资源监视器页面的高级配置下,将 自动创建监视器组选项切换为 ,并添加筛选条件。Azure 监视器组将根据按标签分组选项中的筛选条件自动创建。

自动分配阈值配置文件

  1. 转到 云服务 > Azure,点击 Azure 监视器。点击左侧面板中列出的任意服务类型,然后选择所需的资源监视器。
  2. 将鼠标悬停在显示名称旁边的 汉堡图标 上,然后点击 编辑

编辑 Azure 资源监视器页面的高级配置 > 自动分配阈值配置文件:

  • 覆盖现有设置:切换为 以覆盖现有的阈值配置文件设置。
  • 为每种受支持的服务配置默认阈值配置文件:选择要覆盖的阈值配置文件。
  • 您也可以点击 + 图标新建阈值配置文件。

告警

您可以为每个被监控的 Azure 资源新建或关联现有的阈值配置文件。请按照以下步骤创建阈值配置文件:

  1. 转到您希望关联阈值配置文件的 Azure 资源监视器。
  2. 将鼠标悬停在显示名称旁边的 汉堡图标 上,点击 编辑
  3. 高级配置 > 阈值与可用性下,点击 加号图标 (+)新建配置文件。点击 铅笔图标编辑现有配置文件。
  4. 点击 保存

报表

转到 报表 > Azure。Azure 监视器可用的报表取决于您 Azure 账户中的服务类型。

  • 可用性摘要报表
  • 性能报表
  • 健康趋势报表
  • 库存报表
  • 服务器集成报表

Azure 发现报表

Azure 发现报表提供 Azure 账户中所有资源的汇总视图,帮助您跟踪库存、增长情况和配置变更,实现完整的云可见性。

指导报表

获取最佳实践建议,优化成本并提升 Azure 资源的性能和可靠性。

预测

基于历史观测数据预测未来指标,例如 Azure 资源使用情况。

Site24x7 使用机器学习和传统时间序列预测模型(如指数平滑法)来预测未来值。为选择合适的模型,时间序列数据会被分解为系统性和非系统性组件,如水平、趋势、季节性和噪声。将使用过去 30 天的历史数据来预测未来 30 天的指标使用情况。

查看预测图表:

  1. 转到 云服务 > Azure > 点击 Azure 监视器。点击左侧面板中列出的任意服务类型,然后选择所需的资源监视器。
  2. 导航到 预测标签页查看图表。

支持的服务类型:虚拟机 (VM)、站点、数据库、应用服务计划

容量规划

使用 容量规划,通过 CPU、内存和磁盘利用率等指标优化 Azure 资源并跟踪容量使用情况。

标签

标签可帮助您在监控中包含或排除特定资源。在 Azure 门户中,每个资源都可以关联一个或多个标签。当资源被发现并添加到 Site24x7 进行监控时,在 Azure 门户中创建的标签会自动与 Site24x7 网页控制台中的相应资源关联。

除这些导入的标签外,您还可以新建标签或将现有的 Site24x7 标签关联到资源监视器,以便轻松筛选。您还可以将资源组、服务类型和订阅作为标签添加。 

注意

在 Azure 门户中新添加的标签将在 3 小时后反映到 Site24x7 网页客户端中。

Azure 资源监视器页面

您的所有 Azure 资源将按服务类型列出。选择所需的服务类型和特定资源监视器。Azure 资源监视器页面上有五个标签页:

  • 摘要:查看 Azure 资源的性能指标以及数字属性的最新轮询数据。
  • 配置详情: 
    • ID - 为每个 Azure 资源创建的唯一 ID
    • 资源名称
    • 关联的服务类型
    • 位置
  • 中断
  • 库存
  • 日志报表
  • 服务器集成报表

Azure Deployment Manager (ADM) 健康检查

监控服务的健康状况,及时发现服务健康问题,确保可靠部署和服务的高可用性。请按照以下步骤启动健康检查:

  1. 转到 Azure > 点击 Azure 监视器 > ADM 健康检查
  2. 选择要执行健康检查的 订阅资源组
  3. 点击 复制到剪贴板以复制 JSON 片段。
  4. 将复制的 JSON 片段粘贴到 ADM 部署 JSON 文件的健康检查部分。

完成后,Site24x7 将开始健康检查并验证 Azure 部署的每个步骤。如果成功,部署将移至下一个服务单元。如果检测到任何问题,Azure 将停止部署并提示您进行故障排除,以降低影响范围。

IT 自动化

监控 Azure 资源,并在配置的阈值被突破时安排 IT 自动化操作。

管理操作

 

 

转到 Azure > 点击 Azure 监视器 > 管理操作。在这些管理操作下,您可以对 Azure 资源监视器执行批量操作,例如删除、重新添加和 VM 操作。您可以按订阅、资源组、服务和位置对资源进行分组或筛选,以获得更好的可见性。

注意
只有 Site24x7 管理员或超级管理员才能执行这些操作。

 

  • 删除资源: 使用 垃圾桶图标   删除单个资源。使用右上角的 删除按钮一次性删除多个资源。删除资源后,Site24x7 将停止对其监控,但该资源不会从您的 Azure 账户中删除。
  • VM 专属操作:您可以为每个已发现的 VM 启动/停止 VM,以及安装 Site24x7 服务器监控代理扩展。使用 VM 批量操作按钮,一次性对多个 VM 执行这些操作。

请确保已为创建监视器所用的应用程序提供参与者角色权限。安装 Site24x7 服务器监控代理扩展之前,请确保 VM 已启动并正在运行。 

数据采集 (DC) 如何进行?

Site24x7 向每个资源的 Azure 指标 API 发送一个或多个请求,并获取每分钟的数据。数据采集每五分钟进行一次。Site24x7 分析数据并以用户所需的报表或仪表板格式呈现。如果用户设置了阈值,Site24x7 将检查获取的数据是否超过配置的阈值限制。如有突破,将触发告警并启动配置的补救操作。

 

 

关于资源健康检查:

同样,Site24x7 Azure 监视器每三分钟向 Azure 发送一次资源健康 API 请求,并在数据采集的同时更新资源状态,以便进一步诊断。

安全

Site24x7 Azure 监控采用 Microsoft 批准的工作流程 OpenID Connect 身份验证。Site24x7 不会增加您 Azure 环境的费用,也不会对现有设置进行任何修改。

注意

了解安全最佳实践,以加固您的 Azure 账户。

许可

Azure 主账户消耗一个基础监视器许可证。每个 Azure 资源占用一个基础监视器。例如,如果您要监控一个拥有 10 个资源的 Azure 账户,则需要消耗 11 个基础监视器。例如:

Azure 主账户 = 1 个基础监视器

10 个资源 = 10 个基础监视器

总计 = 11 个基础监视器

如果您已在 VM 上安装了服务器监控代理扩展,则该 VM 将消耗两个基础监视器,服务器监视器也将消耗两个基础监视器。

使用我们的云成本管理工具 ManageEngine Cloudspend,跟踪并管理整个组织的 Microsoft Azure 账单,优化云成本。

常见问题

Site24x7 多久从 Azure 同步一次数据?

Site24x7 每 1 分钟轮询一次 Azure,并收集前 5 分钟窗口的数据。收集的数据在第 6 分钟持久化存储。例如,10:00–10:05 的数据在 10:06 存储,每个周期产生五个数据点。同步接近实时,每 5 分钟更新一次。

当 Azure 资源被删除时,Site24x7 会发生什么?

Site24x7 会将监视器标记为宕机,原因为"资源已移除"。不会立即触发告警。状态会经过 2 次连续数据采集确认。如果两次检查后仍未找到该资源,则根据您的 Azure 监视器终止设置,监视器将被暂停或删除,并发送电子邮件通知。

在哪里可以找到已删除或已暂停的 Azure 监视器的审计记录?

每次因 Azure 资源终止而触发的暂停或删除操作都会记录在审计日志中,并附有说明原因的条目。审计日志保留 1 年,可用于合规和审计目的。

如果同步失败或延迟,Azure 监控数据会怎样?

如果数据采集失败,该次采集将被跳过,且该时间段内不会存储任何数据。例如,如果 Site24x7 在 10:00 发生延迟,则跳过该次采集,下一次成功运行在 10:16。10:05–10:15 的数据将在 10:16 收集并持久化。10:00–10:04 的轮询数据将作为缺口保留。如有数据不一致问题,请联系 Site24x7 支持以请求验证报告。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!