帮助手册

监控 Google Cloud Platform

监控托管在 GCP 中的资源,可以检查其可用性,从全局视角了解其健康状况与性能,并更好地规划资源分配。单击此处查看支持监控的 GCP 服务完整列表。

Site24x7 GCP 监控的优势

  • 在单个资源级别维护可用性。
  • 使用指导报表、库存报表及更多报表优化资源分配。
  • 发生中断或性能下降时立即接收告警。

类型

如何设置监控

  1. 登录 Site24x7 门户。
  2. 在左侧导航窗格中单击,然后单击 GCP > 添加 GCP 监视器
  3. 为监视器提供适当的显示名称并填写项目 ID
  4. 选择您偏好的身份验证方式:
  5. 筛选资源部分:
    1. 服务/资源类型:选择您希望监控的 Google Cloud 资源类型
    2. 指标配置文件:从下拉菜单中选择现有的指标配置文件,或使用该字段旁的 + 图标创建新配置文件,以仅选择您希望 Site24x7 进行 API 调用并收集的指标。
    3. 通过标签包含/排除资源:输入您在 Google Cloud 中使用的标签,以便只将带有这些标签的资源纳入监控或从监控中排除。
    4. 自动发现新资源:启用此字段后,将自动发现并监控在 Google Cloud 控制台中创建的任何新资源。
    5. 发现间隔:设置资源自动发现的频率。
  6. 高级配置部分:
    1. 接收 GCP 服务建议通知:启用后,当 Google Cloud 提供服务优化或节省成本的建议时,Site24x7 将主动向您发送通知。
    2. 将已停止的 VM 实例标记为维护:启用后,将已停止的虚拟机(VM)自动归类为计划内维护状态。当已知 VM 临时关闭时,可减少不必要的告警和误报。
    3. 在基础监视器许可证单位耗尽时发出通知:启用后,当基础监视器单位的使用量接近或达到分配上限时,您将收到告警。
    4. 许可证单位耗尽时停止重新发现:启用后,一旦超出许可证限制,将阻止自动重新发现新资源,避免监控延迟或错误。
    5. 自动创建监视器组
      • :将以项目名称创建监视器组,项目中的所有资源将列于该监视器组下。
      • :不创建监视器组。
    6. 集成后显示服务器监视器
      • :VM 的性能和健康指标将同时列于服务器选项卡和 Google Cloud VM 监视器页面。
      • :VM 的性能和健康指标仅列于 Google Cloud VM 监视器页面。
    7. 从代理配置同步显示名称
      • :服务器监视器名称将与资源名称同步。
      • :服务器监视器名称将与 VM 的主机名同步。
    8. 启用服务配额:
      • :启用 Google Cloud 配额监控。在组织级别启用服务配额后,将为所有关联项目启用配额监控。
      • :禁用 Google Cloud 配额监控。
    9. 服务配额指标配置文件:选择包含所需云配额供监控使用的 GCP 服务配额指标配置文件。
  7. 资源终止设置部分:
    1. 静默资源终止告警
      • :静默 Google Cloud 资源终止时触发的所有告警。
      • :Google Cloud 资源终止时将触发告警。
    2. 监控已终止的资源
      • :当资源在 Google Cloud 门户中终止时,监控将继续,但监视器状态将显示为宕机。
      • :自动将 Google Cloud 门户中已终止的资源从监控中移除。
    3. 自动删除已终止的资源
      • :如果资源在 Google Cloud 门户中终止,相应监视器将在预设时间限制后被移除。您可以在在此时间后删除已终止资源字段中设置时间限制,该字段仅在设置为后才会启用。
      • :将 Google Cloud 门户中已终止资源的相应监视器移至暂停状态,随后将其删除。暂停的监视器不消耗监控许可证。
  8. 指导报表配置部分:
    • 启用所有最佳实践检查并使用默认基准
      Site24x7 的 指导报表使用我们的最佳实践建议检查项分析您的 GCP 账户,并提供降低成本和提升性能的洞察。如需启用所有检查并使用默认基准,请将切换按钮保持为。如需自行选择建议并配置自定义基准(仅适用于以下检查:VM 实例 - 低使用率VM 实例 - 高使用率),请将该选项切换为。 
    • 如何为 VM 实例检查创建新基准?

      1. 启用所有最佳实践检查并使用默认基准选项切换为。页面将刷新,并显示列出所有指导报表检查项的新部分。

      2. 选择 VM 实例 - 低使用率VM 实例 - 高使用率检查,并为 CPU 使用率、网络入流量和网络出流量指标配置新值。
      3. 单击保存
  9. 在"自动分配阈值配置文件"部分:
    1. 前往 > GCP,单击 GCP 监视器。单击左侧面板中列出的任一服务类型,然后选择所需的资源监视器。
    2. 将鼠标悬停在显示名称旁的汉堡菜单图标 上,然后单击编辑
    3. 编辑 GCP 资源监视器页面的高级配置 > 自动分配阈值配置文件下:
      • 覆盖现有设置:切换为以覆盖现有阈值配置文件设置。
      • 为每个支持的服务配置默认阈值配置文件:选择您希望覆盖的阈值配置文件。
      • 您也可以单击 + 图标创建新的阈值配置文件。
  10. 配置文件部分:
    1. 关联监视器组:选择您希望与正在创建的监视器关联的监视器组。使用 + 图标创建新的监视器组。
    2. 依赖的监视器:选择正在创建的监视器所依赖的监视器。例如,如果您的 Google Cloud 项目监视器依赖于某个组织监视器,当组织监视器宕机时,只会触发一条针对组织监视器的告警,而不会再触发冗余的项目监视器告警。这样可以减少告警疲劳。
    3. 标签:选择您希望与正在创建的监视器关联的标签。单击添加标签按钮创建新标签。
    4. IT 自动化模板:在选择自动化下拉菜单中通过 IT 自动化模板设置自动修复操作,以在中断和性能下降场景中运行,并在下一个字段中设置执行条件。
    5. 在计划维护期间执行 IT 自动化:勾选此复选框,即使在计划维护时间段内也运行自动修复 IT 自动化操作。
  11. 告警设置部分:
    1. 用户告警组:选择您希望接收正在创建的监视器相关通知的用户告警组。
    2. 值班计划:选择值班计划,以便告警在适当的时间发送给适当的人员。
    3. 通知配置文件:选择所需的通知配置文件以设置通知的发送方式。使用 + 图标创建新的通知配置文件。
  12. 单击开始 GCP 监控
注意

Google Cloud 资源发现将开始启动。发现完成后,您将被重定向到服务视图仪表板。

服务视图

单击 > GCP > Google Cloud 监视器 > 服务视图可查看此仪表板。创建新的 Google Cloud 监视器后,您也将看到此页面。服务视图仪表板包含按各服务类型分组的所有 Google Cloud 资源监视器。

基础设施仪表板

单击 > GCP > Google Cloud 监视器 > 基础设施仪表板可查看此仪表板。此仪表板以 NOC 视图呈现您账户中发现的所有 Google Cloud 资源监视器。除每种资源类型下监视器的 NOC 视图外,您还可以按服务类型、位置或状态筛选监视器。将鼠标悬停在每个 NOC 方块上可显示监视器的显示名称,单击后将跳转到相应监视器的页面。

库存仪表板

单击 > GCP > Google Cloud 监视器 > 库存仪表板可查看此仪表板。此仪表板以环形图形式显示正在监控的 Google Cloud 资源数量、按服务类型划分的 Google Cloud 资源每日使用量,以及各资源类型下 Google Cloud 资源监视器的报表视图(含位置、资源数量和可用区详情)。

自定义仪表板

除上述三个内置仪表板外,您还可以创建自定义仪表板,以您偏好的方式查看您喜爱的指标。要创建自定义仪表板,单击首页 > 仪表板 > 自定义仪表板 > + 新建。有关创建自定义仪表板的详细说明,请参阅我们的自定义仪表板帮助文档

所有资源

单击 > GCP > Google Cloud 监视器 > 所有资源可查看此页面。此页面显示按状态划分的监视器数量、许可证使用情况及所有监视器的列表。每个监视器旁的汉堡菜单图标提供各 Google Cloud 资源监视器的操作选项,如编辑、添加到监视器组、计划维护、暂停或删除。

管理操作

单击 > GCP > Google Cloud 监视器 > 管理操作可查看管理操作页面,该页面允许您在 Site24x7 控制台中管理您的 Google Cloud 资源。

管理操作页面列出活跃和已删除的 Google Cloud 资源监视器。在活跃资源选项卡中,您可以执行启动或停止 VM 等操作。在已删除资源选项卡中,您可以重新添加已删除的监视器。

注意

执行管理操作需要您的 Site24x7 账户具备管理员或超级管理员级别的访问权限。

操作

单击 > GCP > Google Cloud 监视器 > 操作可查看操作页面。此页面列出在 Google Cloud 控制台中执行的操作,帮助管理员进行故障排除。

注意

此页面显示的数据通过 API 获取,仅显示最近 500 条操作记录。Site24x7 不存储这些数据。

指导报表

单击 > GCP > Google Cloud 监视器 > 指导报表可查看 Site24x7 的 Google Cloud 指导报表,该报表根据您的 Google Cloud 资源提供最佳实践建议。Site24x7 收集了行业最佳实践,并将其整理为指导报表,按建议操作后可提升您的 Google Cloud 配置的可靠性、可用性和成本效益。请参阅我们关于指导报表的帮助文档了解更多信息。

使用服务器监控代理增强 VM 监控

默认的 Google Cloud 计算实例监控在 Google Cloud 资源层面提供计算实例的健康和性能指标。若要获得增强的监控能力,并监控 CPU 使用率和磁盘使用率等健康和性能指标,我们建议在您的 Google Cloud VM 中安装我们的服务器监控代理软件包。

要安装我们的轻量级服务器监控代理,请按照安装服务器监控代理帮助文档中的说明操作。

告警

通过阈值配置文件配置何时触发告警。创建配置文件可以更轻松地将此配置应用到多个监视器。

要配置阈值配置文件,单击 > GCP > Google Cloud 监视器 > Google Cloud 资源监视器旁的汉堡菜单图标 > 编辑

配置文件部分的阈值与可用性字段中使用下拉菜单。如果您尚未创建阈值配置文件,请单击字段旁的 + 图标创建新的阈值配置文件。请参阅我们关于阈值与可用性的帮助文档了解更多告警设置信息。

容量规划

启用容量规划,评估 Google Cloud 资源的历史使用趋势。它通过可视化 CPU、内存、磁盘和网络使用率等指标来预测未来需求,帮助您做出明智的扩缩容决策。借助基于阈值的告警和可自定义的报表,您可以优化资源分配,避免性能瓶颈。这有助于使您的云基础设施更具成本效益和弹性。

Google Cloud 资源的正常运行时间监控

Site24x7 为部分 Google Cloud 资源提供正常运行时间监控,让您可以专注于资源可用性,而无需收集性能指标。此功能非常适合只需要可用性数据、希望通过减少 API 调用来降低云成本的企业。

启用正常运行时间监控后,Site24x7 将仅跟踪 Google Cloud 资源的可用性状态,并以事件时间线和可用性百分比趋势的形式展示数据。请参阅我们的 GCP 正常运行时间监控文档了解更多关于如何启用此经济实惠的监控方式的信息。

Site24x7 如何监控您的 Google Cloud 资源

Site24x7 向每个资源的云 API 发送一个或多个请求,每分钟采集一次数据,每五分钟收集一次。Site24x7 分析数据并以用户所需的报表或仪表板格式呈现。如果用户设置了阈值,Site24x7 会检查采集到的数据是否与配置的阈值限制相符,如有突破则触发告警。

Site24x7 的 GCP 监控从用户在 Site24x7 Web 客户端上传的服务账号 JSON 文件中获取访问密钥。JSON 文件中的私钥以加密格式存储。GCP 监控的性能指标通过 GCP Monitor REST API 收集。了解启用 GCP 监控所需的权限

许可证消耗

父级 Google Cloud 项目监视器消耗一个基础监视器许可证。此外,每个 Google Cloud 资源消耗一个基础监视器许可证。每个 Google Cloud VM 实例(Compute Engine)消耗两个基础监视器许可证。

举例说明:如果您的 Google Cloud 配置包含三个 Compute Engine、两个 Firebase 数据库和一个 Cloud Router,则共消耗 10 个基础监视器许可证。

下一步操作

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!