AWS Elastic Disaster Recovery 集成
AWS Elastic Disaster Recovery(DRS)是一种经济高效、可靠的灾难恢复解决方案,可最大限度地减少宕机时间、防止数据丢失,并为您的服务器保持最新备份。
概述
Site24x7 与 AWS DRS 的集成提供了一种简便的方式来监控和管理灾难恢复操作。此集成可对您的 AWS DRS 环境进行实时监控,追踪灾难恢复配置的健康状况和性能。

除Elastic Disaster Recovery 监视器外,它还提供两个子监视器:
使用场景
假设您拥有一个 Elastic Disaster Recovery 监视器,其中包含多个源服务器以及源服务器的恢复实例,您希望在灾难恢复事件中检索这些实例。
在此场景中,如果您的 DRS 环境已与 Site24x7 集成,您即可获取 DRS 摘要的关键洞察,并针对每个区域监控源服务器和恢复实例。此集成还允许您监控 CloudWatch 指标,以便及时采取适当措施,最大限度地减少本地和云应用程序的宕机时间和数据丢失。
Site24x7 DRS 集成的优势
将您的 DRS 环境与 Site24x7 集成,可实现以下功能:
- 获得灾难恢复环境的全面视图。
- 针对每个区域单独监控源服务器和恢复实例。
- 为指标设置阈值,并在阈值突破时接收告警。
- 管理、优化并确保灾难恢复流程的可靠性。
设置与配置
- 登录您的 Site24x7 账户。
- 前往云 > AWS > 集成 AWS 账户,并创建跨账户 IAM 角色,以授权 Site24x7 访问您的 AWS 资源。
- 在集成 AWS 账户页面,从待发现服务列表中选择 Elastic Disaster Recovery。
权限
请确保 Site24x7 拥有以下权限以监控 DRS:
- "drs:DescribeSourceServers"
- "drs:ListStagingAccounts"
- "drs:ListTagsForResource"
- "drs:GetReplicationConfiguration"
- "drs:GetLaunchConfiguration"
- "drs:DescribeRecoveryInstances"
轮询频率
Site24x7 根据设定的轮询频率(从每分钟一次到每天一次)查询 AWS 服务级别 API,以从 Elastic Disaster Recovery 监视器收集指标。
支持的指标
Elastic Disaster Recovery
Elastic Disaster Recovery 监视器支持的指标如下:
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| Total Source Server Count | 源服务器总数 | 最大值 | 数量 |
| Active Source Server Count | 活跃源服务器总数 | 最大值 | 数量 |
DRS Source Server
DRS Source Server 监视器支持的指标如下:
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| Backlog | 尚未同步的数据量 | 平均值 | 字节 |
| Elapsed Replication Duration | 自上次演练或恢复实例启动以来所经过的时间 | 平均值 | 秒 |
| Duration Since Last Successful Recovery Launch | 该服务器累计进行复制的时间 | 平均值 | 秒 |
| Replication Progress | 服务器存储已成功复制的百分比 | 平均值 | 百分比 |
| Lag Duration | 最新一致性快照的时间差 | 平均值 | 秒 |
DRS Recovery Instance
DRS Recovery Instance 监视器支持的指标如下:
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| Lag Duration | 最新一致性快照的时间差 | 平均值 | 秒 |
| Backlog | 已写入已启动恢复实例但尚未复制到目标服务器的数据量 | 平均值 | 字节 |
| Elapsed Replication Duration | 自反向复制启动以来所经过的时间 | 平均值 | 秒 |
| Replication Progress | 恢复实例复制完成的百分比进度 | 平均值 | 百分比 |
阈值配置
为 Elastic Disaster Recovery 监视器配置阈值:
- 登录您的 Site24x7 账户,前往管理 > 配置文件 > 阈值与可用性。
- 点击添加阈值配置文件。
- 从监视器类型下拉菜单中选择适用的监视器类型,并在显示名称字段中填写合适的名称。适用的监视器类型为 Elastic Disaster Recovery、DRS Source Server 和 DRS Recovery Instance。
- 支持的指标将显示在阈值配置部分。您可以为上述所有指标设置阈值。
- 点击保存。
您可以通过状态传播功能管理所有告警,确保通知通过父监视器发送。
授权
- Elastic Disaster Recovery:每个 Elastic Disaster Recovery 监视器占用一个基础监视器授权。
- DRS Source Server:每个 DRS Source Server 监视器占用一个基础监视器授权。
- DRS Recovery Instance:每个 DRS Recovery Instance 监视器占用一个基础监视器授权。
查看 DRS 数据
要监控您的 DRS 环境,请登录 Site24x7 账户,前往云 > AWS > Elastic Disaster Recovery。
监视器数据
每个 Elastic Disaster Recovery 监视器及其子监视器的监视器数据如下。
Elastic Disaster Recovery
您可以在以下标签页中查看 Elastic Disaster Recovery 监视器数据。
摘要
摘要标签页以图表形式提供事件时间线和指标的概览。您还可以在配置部分查看区域、源服务器总数和活跃源服务器数等详细信息。
源服务器
在此标签页中查看源服务器可用性以及 DRS Source Server 监视器的名称、滞后时长和积压数据量。点击阈值配置可为 DRS Source Server 监视器配置阈值。

点击监视器名称即可查看 DRS Source Server 监视器详情。
恢复实例
恢复实例标签页显示恢复实例可用性以及 DRS Recovery Instance 监视器的名称、滞后时长和积压数据量。点击阈值配置可为 DRS Recovery Instance 监视器配置阈值。

点击监视器名称即可查看 DRS Recovery Instance 监视器详情。
中断
中断标签页提供中断的开始时间、结束时间、持续时长及评论(如有)的详细信息。
清单
在清单标签页中可获取资源名称、区域和监视器授权类别等详细信息。还可以在此标签页中根据用户需求设置和查看阈值与可用性配置文件和通知配置文件。
日志报表
此标签页提供每个 Elastic Disaster Recovery 监视器日志状态的汇总报表,可下载为 CSV 文件。
DRS Source Server
您可以在以下标签页中查看 DRS Source Server 监视器数据。
摘要
摘要标签页以图表形式提供事件时间线、滞后时长和指标的概览。

恢复实例
恢复实例标签页显示恢复实例可用性以及 DRS Recovery Instance 监视器的名称、滞后时长和积压数据量。点击阈值配置可为 DRS Recovery Instance 监视器配置阈值。点击监视器名称即可查看 DRS Recovery Instance 监视器详情。
配置详情
在此标签页中查看 DRS Source Server 监视器的配置详情,包括区域、AWS 源服务器 ID、代理版本和 AWS 实例 ID。
复制设置
复制设置标签页显示 DRS Source Server 监视器的复制设置,包括区域、AWS 源服务器 ID、子网和复制服务器实例类型。
启动设置
启动设置标签页提供 DRS Source Server 监视器的启动设置详情,包括区域、AWS 源服务器 ID 和实例类型的右大小化信息。
中断
中断标签页提供中断的开始时间、结束时间、持续时长及评论(如有)的详细信息。
清单
在清单标签页中可获取资源名称、区域和监视器授权类别等详细信息。还可以在此标签页中根据用户需求设置和查看阈值与可用性配置文件和通知配置文件。
日志报表
此标签页提供每个 DRS Source Server 监视器日志状态的汇总报表,可下载为 CSV 文件。
DRS Recovery Instance
您可以在以下标签页中查看 DRS Recovery Instance 监视器数据。
摘要
摘要标签页以图表形式提供事件时间线、滞后时长和指标的概览。

受监控资源
受监控资源标签页列出由 Site24x7 管理和监控的所有资源。
配置详情
在此标签页中查看 DRS Recovery Instance 监视器的配置详情,包括区域、AWS 恢复实例 ID、恢复实例 ARN 和代理版本。
中断
中断标签页提供中断的开始时间、结束时间、持续时长及评论(如有)的详细信息。
清单
在清单标签页中可获取资源名称、区域和监视器授权类别等详细信息。还可以在此标签页中根据用户需求设置和查看阈值与可用性配置文件和通知配置文件。
日志报表
此标签页提供每个 DRS Recovery Instance 监视器日志状态的汇总报表,可下载为 CSV 文件。
