重启 ElastiCache 集群
使用 Site24x7 的 IT 自动化框架,您可以创建操作配置文件,自动重启并刷新已监控的 Redis 和 Memcached 兼容缓存节点/集群上的所有键值。您可以选择重启集群中部分或全部缓存节点,也可以重启整个集群。
所需权限
请确保 Site24x7 承担的 IAM 角色或为 Site24x7 创建的 IAM 用户在附加的策略文档中具有以下部分写入操作权限,以执行相关操作。
- elasticache:RebootCacheCluster
约束条件
- 重启缓存集群仅支持 Memcached 缓存引擎类型。
- 要执行该操作,缓存节点/集群必须处于运行状态,且需要由 Site24x7 进行监控。
创建操作配置文件
- 登录 Site24x7 Web 控制台,选择管理 > IT 自动化模板
- 单击下拉菜单并选择要执行的操作(即 Memcached 引擎类型的集群和节点级重启,以及 Redis 引擎类型的节点级重启)
- 提供适当的显示名称以便识别
- 要执行的操作将在下方字段中自动填充
- 接着,单击下拉菜单选择需要重启的缓存节点/集群列表(您可以选择 $LOCALHOST 选项,对所有已映射的缓存集群/节点执行操作)
- 最大允许操作执行时间:Site24x7 在请求超时前等待的最长秒数。执行时间默认设置为 15 秒。您可以设置 1 到 90 秒之间的执行时间。
- 通过电子邮件发送自动化结果:将此项切换为"是",可选择通过电子邮件接收自动化结果。通过电子邮件将自动化结果分享给通知配置文件中配置的用户告警组。该邮件将包含自动化名称、自动化类型、事件原因、目标主机等参数。
- 保存配置文件
模拟自动化
在映射操作配置文件之前,您可以通过在 Site24x7 控制台中手动调用运维任务,或使用我们的 REST API 来测试其功能。此操作用于检查执行重启操作所需的相应写入级别权限是否已到位。若要测试,请返回 IT 自动化摘要页面,单击
执行演练。
映射操作配置文件
若要执行自动化,请将操作配置文件映射到所需的告警事件。您可以将配置文件映射到预定义的监视器级别事件类型,也可以映射到自定义属性级别事件类型。
监视器级别映射
导航到已监控的 ElastiCache 节点/集群的编辑监视器页面,将操作配置文件与以下任意监视器状态变更进行映射。
- 状态变为宕机时执行
- 状态恢复时执行
- 状态变为告警时执行
- 任意状态变更时执行
属性级别映射
您还可以将操作配置文件关联到任何已监控的 AWS 资源或应用程序相关指标数据点,例如 CPU 使用率、连接数、读写 IOPS 等。导航到已监控 AWS 资源或应用程序服务的编辑阈值配置文件页面(导航至资源的编辑监视器页面 > 单击阈值与可用性字段旁的铅笔图标),然后单击"选择要执行的自动化"字段,将配置文件映射到所需的属性。
