启动、停止和故障转移重启 RDS DB 实例
借助 Site24x7 的 IT 自动化框架,您可以创建操作配置文件,以便在事件发生时自动启动、停止或故障转移重启受监控的 Amazon 关系数据库实例。您可以针对受监控 AWS 环境中发生的各类告警事件触发自动化,例如指标超出定义的阈值,或监视器级别状态变更(正常/宕机/异常)。
所需权限
请确保分配给 Site24x7 IAM 实体/IAM 角色的策略中包含以下读取级别权限。
- "rds:RebootDBInstance"
- "rds:StopDBInstance"
- "rds:StartDBInstance"
限制条件
- 如果 DB 实例不处于"可用状态",则无法停止或重启该实例。
- 操作只能对 Site24x7 已监控的 DB 实例执行。
- AWS 内关于停止 DB 实例的所有限制(多可用区部署、只读副本和 7 天停止期限)在此同样适用。
创建操作配置文件
- 登录 Site24x7 Web 控制台,选择管理 > IT 自动化模板。
- 单击下拉列表,选择"启动/停止/故障转移重启 RDS"作为类型。
- 在显示名称字段中输入唯一名称以便识别。
- 接下来,单击下拉菜单,选择要执行操作的已监控 RDS DB 实例列表。
- 最大允许操作执行时间:Site24x7 在请求超时前等待的最大秒数,可输入 1 到 90 秒之间的值。
- 通过邮件发送自动化结果:将开关设置为"是",可选择通过邮件接收自动化结果,并将结果发送至通知配置文件中配置的用户告警组。邮件内容包括自动化名称、自动化类型、事件原因、目标主机等参数。
- 保存配置文件。
模拟自动化
在映射操作配置文件之前,您可以在 Site24x7 控制台中手动触发操作,或使用 REST API 来测试其功能,以验证是否已提供适当的写入级别权限。创建配置文件后,返回 IT 自动化摘要页面(管理 > IT 自动化),单击
执行测试运行。
映射操作配置文件
要执行自动化,请将操作配置文件映射到所需的告警事件。您可以将配置文件映射到预定义的监视器级别事件类型,或自定义的属性级别事件类型(例如数据库连接数 < 10)。
监视器级别映射
导航至受监控 RDS DB 实例的监视器编辑页面("RDS 实例监视器页面" >
> 编辑),将操作配置文件映射到以下任一监视器状态变更。
- 宕机时执行
- 恢复时执行
- 异常时执行
- 任意状态变更时执行
属性级别映射
您还可以将操作配置文件关联到 RDS 相关的指标数据点,如 CPU 使用率、连接数、读写 IOPS 等。导航至受监控 RDS DB 实例的阈值配置文件编辑页面(进入资源的监视器编辑页面 > 单击阈值和可用性字段旁的铅笔图标),然后单击"选择要执行的自动化"字段,将配置文件映射到所需属性。
使用场景
停止未充分利用的 RDS DB 实例或测试/开发环境中运行的实例,以减少使用时长并降低成本。
