自动化启动、停止、休眠停止和重启 EC2 实例
使用 Site24x7 的 IT 自动化框架,您可以创建操作配置文件来启动、停止、休眠停止或重启 EC2 实例。您可以通过将自动化与阈值或告警事件类型(Up、Down 和告警)映射,设置自动触发;也可以通过直接从 Site24x7 控制台手动调用操作来直接调用 API。
所需权限
请确保 Site24x7 所使用的 IAM 角色或为 Site24x7 创建的 IAM 用户在附加的策略文档中具有以下部分写入操作权限,以执行相应操作。
- "ec2:StartInstances"
- "ec2:StopInstances"
- "ec2:RebootInstances"
限制条件
- EC2 实例需处于运行状态,且需由 Site24x7 监控,才能成功执行操作。
- 无法对处于暂停状态的实例执行操作。
创建操作配置文件
- 登录 Site24x7 Web 控制台,选择Admin > IT Automation Templates。
- 点击添加自动化,然后从下拉列表中选择启动/停止/休眠停止/重启 EC2/创建 AWS EC2 AMI作为类型。
- 在显示名称字段中输入唯一名称。
- 点击下拉列表并选择要执行的操作。
- 接下来,选择要执行操作的 EC2 实例。(如果选择 $LOCALHOST选项,操作将在所有已映射该自动化配置文件的 EC2 实例上执行。)
- 最大允许操作执行时间:Site24x7 在请求超时前等待的最大秒数。默认执行时间设置为 15 秒,您可以设置 1-90 秒之间的执行时间。
- 通过电子邮件发送自动化结果:切换为"是",选择通过电子邮件接收自动化结果。将自动化结果通过电子邮件发送到在通知配置文件中配置的用户告警组。该电子邮件将包含自动化名称、自动化类型、事件原因、目标主机等参数。
- 保存配置文件。
模拟自动化
在映射操作配置文件之前,您可以通过在 Site24x7 控制台中手动调用操作或使用 REST API 来测试其功能。创建配置文件后,返回 IT 自动化摘要页面(Admin > IT Automation),点击
执行测试运行。
映射操作配置文件
要执行自动化,请将操作配置文件映射到所需的告警事件。您可以将配置文件映射到预定义的监视器级别事件类型(Up/Down/告警),也可以映射到自定义属性级别事件类型(CPU 使用率 > 90%)。
监视器级别映射
导航至受监控 EC2 实例的编辑监视器页面("EC2 实例监视器页面" >
> 编辑),并将操作配置文件与以下任意监视器状态变更进行映射。
- 宕机时执行
- 恢复时执行
- 告警时执行
- 任意状态变更时执行
属性级别映射
您还可以将操作配置文件与 EC2 相关指标数据点(如 CPU 使用率、内存使用率)或负载均衡器相关指标(延迟、HTTP 4xx 等)关联。导航至受监控 EC2 实例的编辑阈值配置文件页面(导航至资源的编辑监视器页面 > 点击阈值和可用性字段旁的铅笔图标),并通过点击"选择要执行的自动化"字段将配置文件映射到所需属性。
使用场景
- 排查状态检查失败的实例:您可以设置映射,使得当受监控的 Amazon EC2 实例未通过系统或实例可达性检查时,自动触发重启该实例或停止后再启动该实例的操作。
- 防止内存不足故障:将 EC2 重启操作配置文件映射到内存利用率指标数据点,并设置当内存使用率接近危险阈值时触发。
- 减少已消耗的实例小时数:将 EC2 停止操作配置文件映射到 CPU 使用率和网络利用率等指标数据点,以识别低利用率实例并将其停止。
