帮助手册

开始监控您的 Google Cloud Platform 资源

Site24x7 通过 Site24x7 的 Cloud API 监控您的 Google Cloud Platform(GCP)资源的健康状况和性能。每五分钟采集一次的数据将与您阈值配置文件中设定的安全限制进行比对。如有超出,将触发告警;如有需要,自动修复功能还可执行基础的自愈操作。

使用 Site24x7 监控 Google Cloud 资源的步骤

 

步骤 1:

在 Google Cloud 控制台中创建服务账号

登录您的 Google Cloud 控制台以创建服务账号。服务账号可代表 Site24x7 执行指标采集。请参阅此帮助文档,了解创建服务账号的前提条件和操作说明。

步骤 2:

为服务账号分配权限

监控资源性能只需最低权限即可。

适用范围 所需权限
监控性能指标
  • Viewer
  • Browser(用于监控组织账号)
管理操作(如启动或停止虚拟机)
  • compute.instances.start
  • compute.instances.stop
步骤 3:

导出 JSON 密钥

JSON 密钥包含服务账号的身份验证凭据。

  1. 在 Google Cloud 控制台中,依次导航至 IAM & Admin > Service Accounts
  2. 打开您要为其创建密钥的服务账号。
  3. Keys 选项卡下,点击 Add key > Create New Key
  4. 选择 JSON 作为密钥类型,然后点击 Create
步骤 4:

配置 Site24x7 监视器

准备就绪。

  1. 登录 Site24x7 平台。
  2. 依次导航至 > 添加 GCP 监视器
  3. 输入显示名称和项目 ID,然后上传 JSON 密钥。
  4. 点击开始 GCP 监控

自定义您的 GCP 监视器

说明:
点击开始 GCP 监控按钮后,监视器将以默认设置创建。如需自定义 GCP 监视器,可在创建阶段或之后任何时候进行配置,方法是:导航至 GCP 监视器 > 点击监视器名称旁边的汉堡图标 > 点击编辑
  1. 筛选资源部分:
    1. 服务/资源类型:选择您要监控的 Google Cloud 资源类型
    2. 指标配置文件:从下拉菜单中选择已有的指标配置文件,或点击此字段旁的 + 图标创建新配置文件,以仅选择您希望 Site24x7 调用 API 并采集的指标。
    3. 使用标签包含/排除资源:输入您在 Google Cloud 中使用的标签,使得只有带有这些标签的资源才会被纳入或排除在监控范围之外。
    4. 自动发现新资源:启用此字段,可自动发现并监控在 Google Cloud 控制台中新创建的资源。
    5. 发现间隔:设置资源自动发现的频率。
    6. 自动创建监视器组
      • :将以项目名称创建一个监视器组,项目中的所有资源将列于该监视器组下。
      • :不创建监视器组。
    7. 集成后显示服务器监视器
      • :虚拟机的性能和健康指标将同时列于服务器选项卡以及 Google Cloud 虚拟机监视器页面。
      • :虚拟机的性能和健康指标仅列于 Google Cloud 虚拟机监视器页面。
    8. 从 Agent 配置同步显示名称
      • :服务器监视器名称将与资源名称同步。
      • :服务器监视器名称将与虚拟机主机名同步。
  2. 资源终止设置部分:
    1. 静默资源终止告警
      • :静默 Google Cloud 资源被终止时触发的所有告警。
      • :Google Cloud 资源被终止时触发告警。
    2. 监控已终止资源
      • :当 Google Cloud 门户中的资源被终止时,继续监控,但监视器状态将显示为宕机。
      • :自动将 Google Cloud 门户中已终止的资源从监控中移除。
    3. 自动移除已终止资源
      • :若 Google Cloud 门户中的资源被终止,相应监视器将在预设时限后被移除。您可以在终止资源保留时长字段中设置时限,仅在选择后生效。
      • :将 Google Cloud 门户中已终止资源的相应监视器移入暂停状态,然后将其删除。暂停状态的监视器不消耗监控许可证。
  3. 指导报告配置部分:
    • 启用所有最佳实践检查并使用默认基线
      Site24x7 的指导报告会使用我们的最佳实践建议检查分析您的 GCP 账户,并提供降低成本、提升性能的洞察。如需启用所有检查并使用默认基线,请将开关保持在。如需自定义建议并配置自定义基线(仅适用于以下检查:虚拟机实例 - 低使用率虚拟机实例 - 高使用率),请将开关切换为
    • 如何为虚拟机实例检查创建新基线?

      1. 启用所有最佳实践检查并使用默认基线选项切换为。页面将刷新,并显示列出所有指导报告检查的新部分。

      2. 选择虚拟机实例 - 低使用率虚拟机实例 - 高使用率检查项,并为 CPU 使用率、网络入流量和网络出流量等指标配置新值。
      3. 点击保存
  4. 在"自动分配阈值配置文件"部分:
    1. 依次导航至 > GCP,点击 GCP 监视器。点击左侧面板中列出的任意服务类型,然后选择所需的资源监视器。
    2. 将鼠标悬停在显示名称旁边的汉堡图标 上,然后点击编辑
    3. 编辑 GCP 资源监视器页面中,导航至高级配置 > 自动分配阈值配置文件
      • 覆盖现有设置:将开关切换为,以覆盖现有阈值配置文件设置。
      • 为所有支持的服务配置默认阈值配置文件:选择要覆盖的阈值配置文件。
      • 您也可以点击 + 图标创建新的阈值配置文件。
  5. 配置文件部分:
    1. 关联监视器组:选择要与所创建监视器关联的监视器组。使用 + 图标创建新的监视器组。
    2. 依赖监视器:选择所创建监视器所依赖的监视器。举例说明:若 Google Cloud 项目监视器依赖于某个组织监视器,当组织监视器宕机时,只会触发一个针对组织监视器的告警,冗余的项目监视器告警将不会被触发,从而减少告警疲劳。
    3. 标签:选择要与所创建监视器关联的标签。点击添加标签按钮创建新标签。
    4. IT 自动化模板:通过IT 自动化模板在选择自动化下拉菜单中设置中断和性能下降场景下的自动修复操作,并在下一字段中设置执行条件。
    5. 在计划维护期间执行 IT 自动化:勾选此复选框,以在计划维护期间也执行 IT 自动化的自动修复操作。
  6. 告警设置部分:
    1. 用户告警组:选择要接收所创建监视器相关通知的用户告警组。
    2. 值班排班:选择值班排班,确保告警在适当时间发送给合适的人员。
    3. 通知配置文件:选择所需的通知配置文件,设置通知发送方式。使用 + 图标创建新的通知配置文件。
  7. 点击开始 GCP 监控

Site24x7 如何监控您的 Google Cloud 资源

Site24x7 向每个资源的 Cloud API 发送一个或多个请求,并逐分钟推导数据。数据采集每五分钟进行一次。Site24x7 对数据进行分析,并以用户所需的报表或仪表板格式呈现。如果用户设置了阈值,Site24x7 会检查推导出的数据是否超出了配置的阈值限制。如有超出,将通过电子邮件、Microsoft Teams 等即时通讯应用等多种渠道触发告警。

Site24x7 的 GCP 监控通过获取用户在 Site24x7 Web 客户端上传的服务账号 JSON 文件中的访问密钥来实现。JSON 文件中的私钥以加密格式存储。GCP 监控的性能指标通过 GCP Monitor REST API 采集。了解启用 GCP 监控所需的权限

GCP 监控功能

如需进一步了解 Site24x7 GCP 监控平台的主要功能,请参阅以下链接:

在我们专属的 Google Cloud 监控功能帮助文档中了解更多关于 Google Cloud 监控的信息。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!