通过故障转移 RDS 数据库实例启动、停止和重启

借助 Site24x7 的 IT 自动化框架,您可以创建一个动作配置文件来自动启动、停止或重新启动,并通过故障转移监控的 Amazon Relational 数据库实例来响应事件。您可以触发自动化以响应您监控的 AWS 环境中发生的各种告警事件;指标超过定义的阈值;或用于监视器级别的更改,例如正常/停机/故障的。

所需权限

请确保附加到所创建的 Site24x7 IAM 实体/IAM 角色的策略中存在以下读取级别权限。

  • “rds:RebootDBInstance”
  • “rds:StopDBInstance”
  • “rds:StartDBInstance”

约束

  • 如果数据库实例不处于“可用状态”,您将无法停止或重新启动它
  • 只能在 Site24x7 监控的数据库实例上执行操作
  • AWS 中适用于停止数据库实例的所有限制 - 多可用区部署、只读副本和 7 天停止期也适用于此。

创建动作配置文件 

  • 登录到 Site24x7 Web 控制台,选择管理IT 自动化模板
  • 单击下拉列表并选择“ Start/Stop/Reboot with Failover RDS ”作为类型
  • 在“显示名称字段中输入唯一名称以进行识别。
  • 接下来,单击下拉列表并选择要在其中执行操作的监控 RDS 数据库实例列表。
  • 最大允许动作执行时间:Site24x7 在请求超时之前必须等待的最大秒数。您可以输入 1-90 秒范围内的值。
  • 通过电子邮件发送自动化结果:您可以通过将切换按钮设置为是来选择接收有关自动化结果的电子邮件。通过电子邮件将自动化结果共享给在通知配置文件中配置用户告警组。此电子邮件将包含参数,包括自动化名称、自动化类型、事件原因、目标主机等。
  • 保存配置文件。

模拟自动化

在映射动作配置文件之前,您可以通过在 Site24x7 控制台中手动调用操作或使用我们的 REST API 来测试其功能。这样做是为了检查是否提供了适当的写入级别权限。创建配置文件后,导航回 IT 自动化摘要页面(管理IT 自动化)并单击 以执行测试运行。

映射动作配置文件

要执行自动化,请将动作配置文件映射到所需的告警事件。您可以将配置文件映射到预定义的监视器级别事件类型或自定义属性级别事件类型(数据库连接数 < 10)。

监视器级别映射

导航到监控的 RDS 数据库实例的编辑监控页面(“RDS 实例监控页面”> > 编辑),并将动作配置文件映射到以下任何监视器状态更改。

  • 停机执行
  • 正常执行
  • 遇到问题执行
  • 执行任何状态更改

属性级映射

您还可以将动作配置文件与 RDS 相关的指标数据点相关联,例如 CPU 使用率、连接数、读写 IOPS 等。导航到监控的 RDS 数据库实例的编辑阈值配置文件页面(导航到资源的编辑监视器页面 > 单击阈值和可用性字段旁边的铅笔图标)并通过单击将配置文件映射到任何所需的属性选择要执行的自动化字段。

用例

停止未充分利用的 RDS 数据库实例或在您的测试或开发环境中运行的实例,以减少使用时间并节省成本。