阿里云 Cloud HSM 监控集成
Site24x7 为阿里云 Cloud HSM 实例提供端到端监控。通过实时采集 CPU 使用率、内存利用率、活动连接数、同步状态和整体健康状况等指标,您可以确保 Cloud HSM 集群以最优状态安全运行。将阿里云账号与 Site24x7 集成后,所有 Cloud HSM 实例将自动发现并持续受到监控。
使用场景
- CPU 和内存监控:追踪 Cloud HSM 实例的 CPU 和内存使用情况,防止资源耗尽。
- 连接跟踪:监控活动的 HSM 客户端连接数,确保运行就绪状态并识别连接峰值。
- 集群同步监控:确保 Cloud HSM 集群中所有 HSM 节点保持同步,以维护密钥一致性。
- 健康监控:检测不健康的 Cloud HSM 实例,以维持高可用性和安全性。
- 主动告警与自动化:使用阈值和 IT 自动化规则,在问题影响服务之前提前响应。
设置与配置
- 登录您的 Site24x7 账号,导航至云 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面,从服务类型列表中选择 Cloud HSM。
- 添加完成后,转到云 > 阿里云 > Cloud HSM,查看仪表板和性能指标。
支持的指标
支持的指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| CPU Utilization | Cloud HSM 实例使用的 CPU 百分比。 | 百分比 |
| Memory Utilization | Cloud HSM 实例使用的内存百分比。 | 百分比 |
| HSM Connections | 连接到 Cloud HSM 实例的活动客户端连接总数。 | 次数 |
| Sync Status | Cloud HSM 集群的同步状态,确保所有节点具有一致的密钥数据。 | 次数 |
| HSM Healthy Status | Cloud HSM 实例的整体健康状态(1 = 健康,0 = 不健康)。 | 次数 |
阈值配置
- 转到管理 > 配置文件 > 阈值与可用性。
- 为 Cloud HSM 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具可帮助自动解决性能降级问题。当发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行对应的自动化操作。
- 转到管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射到监视器,实现主动解决问题。
配置规则
通过 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。在添加新的 Cloud HSM 监视器时,系统将自动应用这些设置。
