帮助手册

阿里云 Cloud HSM 监控集成

Site24x7 为阿里云 Cloud HSM 实例提供端到端监控。通过实时采集 CPU 使用率、内存利用率、活动连接数、同步状态和整体健康状况等指标,您可以确保 Cloud HSM 集群以最优状态安全运行。将阿里云账号与 Site24x7 集成后,所有 Cloud HSM 实例将自动发现并持续受到监控。

使用场景

  • CPU 和内存监控:追踪 Cloud HSM 实例的 CPU 和内存使用情况,防止资源耗尽。
  • 连接跟踪:监控活动的 HSM 客户端连接数,确保运行就绪状态并识别连接峰值。
  • 集群同步监控:确保 Cloud HSM 集群中所有 HSM 节点保持同步,以维护密钥一致性。
  • 健康监控:检测不健康的 Cloud HSM 实例,以维持高可用性和安全性。
  • 主动告警与自动化:使用阈值和 IT 自动化规则,在问题影响服务之前提前响应。

设置与配置

  • 登录您的 Site24x7 账号,导航至云 > 阿里云 > 添加监视器
  • 编辑阿里云监视器页面,从服务类型列表中选择 Cloud HSM
  • 添加完成后,转到云 > 阿里云 > Cloud HSM,查看仪表板和性能指标。

支持的指标

支持的指标

指标名称描述单位
CPU Utilization Cloud HSM 实例使用的 CPU 百分比。 百分比
Memory Utilization Cloud HSM 实例使用的内存百分比。 百分比
HSM Connections 连接到 Cloud HSM 实例的活动客户端连接总数。 次数
Sync Status Cloud HSM 集群的同步状态,确保所有节点具有一致的密钥数据。 次数
HSM Healthy Status Cloud HSM 实例的整体健康状态(1 = 健康,0 = 不健康)。 次数

阈值配置

  1. 转到管理 > 配置文件 > 阈值与可用性
  2. Cloud HSM 创建或编辑阈值配置文件。
  3. 将配置文件分配给相应的监视器以触发告警。

IT 自动化

Site24x7 的 IT 自动化工具可帮助自动解决性能降级问题。当发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行对应的自动化操作。

  1. 转到管理 > IT 自动化模板
  2. 创建新的自动化规则。
  3. 将规则映射到监视器,实现主动解决问题。

如何为监视器配置 IT 自动化

配置规则

通过 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。在添加新的 Cloud HSM 监视器时,系统将自动应用这些设置。

如何添加配置规则

相关链接

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!