AWS Backup 监控集成
AWS Backup 可集中管理并自动化云端和本地 AWS 服务的数据备份。您可以使用 AWS Backup 配置备份策略并整合备份任务。请注意,AWS Backup 服务并不支持所有 AWS 服务。
通过将 AWS Backup 与 Site24x7 集成,监控 AWS 资源的备份和存储情况。

使用场景
- 使用 AWS Backup,您可以在统一平台上配置备份策略并监控 AWS 资源的备份活动。备份过程中任何未被发现的故障或问题都可能导致数据丢失。假设您已将 AWS Backup 监视器与 Site24x7 集成,并配置了"备份作业失败数量"和"备份作业过期数量"指标,那么您可以为这些指标设置阈值上限,以便在 Site24x7 检测到阈值突破时接收告警。同样,您也可以为其他指标配置阈值上限,并接收被监控资源的告警。
- 考虑这样一个场景:您有一个资源运行着长时间的备份过程,此类长时间备份可能会延误后续的备份流程。借助 AWS Backup 与 Site24x7 的集成,您可以监控备份运行时间,并将其控制在合理范围内,以避免备份运行出现严重延误。
Site24x7 与 AWS Backup 集成的优势
借助 Site24x7 与 AWS Backup 的集成,您可以监控、管理、存储和整理所有资源备份。
通过此集成,您可以:
- 查看备份策略,并监控所有资源类型、单个资源类型或备份保管库的备份作业。
- 监控资源备份、AWS 备份保管库和基于保管库的 AWS 备份资源类型的复制和恢复作业以及恢复点。
- 跟踪所有资源备份、AWS 备份保管库和基于保管库的 AWS 备份资源类型的备份运行时间和备份大小。
设置与配置
- 如果尚未完成,请通过在您的账户和 Site24x7 的 AWS 账户之间创建跨账户 IAM 角色来启用对 AWS 资源的访问。了解更多。
- 在集成 AWS 账户页面,请确认待发现服务字段中已选择 AWS Backup。了解更多。
策略与权限
请确保 Site24x7 具有以下监控 AWS 资源备份所需的权限:
- "backup:ListCopyJobs"
- "backup:ListTags"
- "backup:ListBackupJobs"
- "backup:ListProtectedResources"
- "backup:DescribeGlobalSettings"
- "backup-gateway:ListHypervisors"
- "backup:DescribeRegionSettings"
- "backup:ListRestoreJobs"
- "backup:ListBackupVaults"
- "backup:DescribeBackupVault"
- "backup:ListBackupPlans"
- "backup-gateway:ListGateways"
- "backup-gateway:ListVirtualMachines"
- "backup:ListRecoveryPointsByBackupVault"
- "backup:GetBackupPlan"
- "backup:ListBackupSelections"
轮询频率
Site24x7 根据设置的轮询频率(一分钟到一天)查询 CloudWatch 和其他 AWS 服务级 API,以收集 AWS Backup 的指标。
支持的 AWS Backup 指标
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| 已创建备份作业数量 | AWS Backup 创建的备份作业数量 | Sum | Count |
| 待处理备份作业数量 | 即将在 AWS Backup 中运行的备份作业数量 | Sum | Count |
| 运行中备份作业数量 | 当前在 AWS Backup 中运行的备份作业数量 | Sum | Count |
| 已中止备份作业数量 | 用户取消的备份作业数量 | Sum | Count |
| 已完成备份作业数量 | AWS Backup 完成的备份作业数量 | Sum | Count |
| 失败备份作业数量 | AWS Backup 已调度但未能启动的备份作业数量 | Sum | Count |
| 已过期备份作业数量 | AWS Backup 尝试根据备份保留生命周期删除但未能删除的备份作业数量 | Sum | Count |
| 已创建复制作业数量 | AWS Backup 创建的跨账户和跨区域复制作业数量 | Sum | Count |
| 运行中复制作业数量 | 当前在 AWS Backup 中运行的跨账户和跨区域复制作业数量 | Sum | Count |
| 已完成复制作业数量 | AWS Backup 完成的跨账户和跨区域复制作业数量 | Sum | Count |
| 失败复制作业数量 | AWS Backup 尝试但未能完成的跨账户和跨区域复制作业数量 | Sum | Count |
| 待处理恢复作业数量 | 即将在 AWS Backup 中运行的恢复作业数量 | Sum | Count |
| 运行中恢复作业数量 | 当前在 AWS Backup 中运行的恢复作业数量 | Sum | Count |
| 已完成恢复作业数量 | AWS Backup 完成的恢复作业数量 | Sum | Count |
| 失败恢复作业数量 | AWS Backup 尝试但未能完成的恢复作业数量 | Sum | Count |
| 已完成恢复点数量 | AWS Backup 创建的恢复点数量 | Sum | Count |
| 部分完成恢复点数量 | AWS Backup 已开始创建但未能完成的恢复点数量 | Sum | Count |
| 已过期恢复点数量 | AWS Backup 尝试根据备份保留生命周期删除但未能删除的恢复点数量 | Sum | Count |
| 删除中恢复点数量 | AWS Backup 正在删除的恢复点数量 | Sum | Count |
| 冷存储恢复点数量 | AWS Backup 分层存储到冷存储的恢复点数量 | Sum | Count |
| 备份作业运行时间 | 备份完成所需的时间(从开始时间到完成时间计算) | 最小值、最大值、平均值 | 小时 |
| 备份大小 | 已完成备份的大小 | 最小值、最大值、平均值 | MB |
| 复制作业运行时间 | 备份完成所需的时间 | 最小值、最大值、平均值 | 小时 |
| 复制大小 | 备份副本的大小 | 最小值、最大值、平均值 | MB |
阈值配置
要为您的 Site24x7-AWS Backup 集成监视器配置阈值:
- 登录您的 Site24x7 账户,前往 Admin > Configuration Profiles > Threshold and Availability。
- 点击 Add Threshold Profile。
- 从监视器类型下拉菜单中选择 AWS Backup、AWS Backup Vault、AWS Backup Resource Types 或 AWS Backup Vault Resource Types,并在显示名称字段中提供适当的名称。
- 支持的指标显示在阈值配置部分,您可以为上述所有指标设置阈值。
- 点击保存。
您还可以配置在被监控资源或被监控备份资源类型的状态发生变化时接收通知,方法是切换当被监控资源宕机/故障/严重时以故障通知和当备份资源类型宕机/故障/严重时以故障通知选项。
许可证
以下每种监视器类型各使用一个基础监视器许可证:
- AWS Backup
- AWS Backup Vault
- AWS Backup Resource Type
- AWS Backup Vault Resource Type
查看 AWS Backup
要查看 AWS 资源的备份情况,请登录您的 Site24x7 账户,前往 Cloud > AWS > AWS Backup。
Site24x7 与 AWS Backup 的集成还提供以下三种监视器:
- AWS Backup Vault:AWS Backup Vault 监视器可整理、保护和存储所有资源备份,防止意外和恶意事件的发生。您可以配置指标,以便针对自动化备份失败按保管库接收告警。
- AWS Backup Resource Types:使用 AWS Backup Resource Types 监视器,可监控 Elastic Cloud Compute (EC2)、Relational Database Service (RDS) 等资源类型的所有 AWS 备份。您还可以在单个仪表板中查看不同区域的所有资源类型指标,并分析 AWS 备份资源类型的备份运行时间和备份大小。
- AWS Backup Vault Resource Types:使用 AWS Backup Vault Resource Types 监视器,可查看和存储基于保管库的资源类型备份。它可以在 AWS Backup Vault Resource Type 级别监控复制和恢复作业以及恢复点。此外,您还可以跟踪基于保管库的 AWS 备份资源类型的备份运行时间和备份大小。
AWS Backup 数据
您可以在以下选项卡中查看 AWS 资源的备份数据:
摘要
摘要选项卡提供所有备份作业的概述。您可以从此处查看上次备份作业详情、上次复制作业详情、上次恢复作业详情、上次过期备份作业和上次失败备份作业,以及已配置的指标图表。
拓扑视图
拓扑视图选项卡提供实时的以资源为中心的依赖关系图。它动态追踪您的 AWS Backup、AWS Backup Vault、AWS Backup Resource Types 或 AWS Backup Vault Resource Types 资源与周围 AWS 基础设施的实时连接关系,在告警触发时能更快地进行根因隔离。如果任何连接组件处于严重状态,该状态将在拓扑视图中相应标记,并显示中断原因,让您无需离开监视器页面即可精准定位故障点。与账户级别的拓扑视图不同,此选项卡将可视化范围限定在单个资源,精确回答以下问题:该备份资源连接到哪些资源,以及如果它发生故障会有什么影响?您可以从单个资源追溯完整的依赖链,一直到其主要父实体、服务类型、区域和 AWS 账户级别。
服务类型
在服务类型选项卡中,查看所有已启用备份的服务列表,包括已监控和未监控的服务。
已监控资源
已监控资源选项卡列出所有受备份保护并由 Site24x7 监控的资源。
备份作业
执行资源备份的作业称为备份作业。备份作业选项卡显示某个区域中所有备份作业的列表。
请注意,备份作业选项卡适用于所有备份类型监视器,但仅显示基于监视器类型的备份作业。例如,AWS Backup Vault 监视器将仅显示发生在该保管库中的备份作业。
恢复作业
恢复作业是恢复已备份资源的作业。您可以在恢复作业选项卡中查看某个区域的所有恢复作业。
复制作业
将备份从一个区域复制到另一个区域,或从一个保管库复制到另一个保管库的作业称为复制作业。复制作业选项卡显示某个区域中的所有复制作业。
备份计划
备份计划是帮助自动化作业的配置。例如,您可以为 EC2 实例创建备份计划,每天下午 5 点进行备份并保留一个月。可从备份计划选项卡获取某个区域的所有备份计划列表。
恢复点
恢复点代表在指定时间点某个资源(如 Amazon Elastic Block Store (Amazon EBS) 卷或 Amazon DynamoDB 表)的内容。
恢复点选项卡仅适用于 AWS Backup Vault 和 AWS Backup Vault Resource Types 监视器,它显示保管库中的所有恢复点。
网关
网关选项卡显示连接到虚拟机管理程序及其虚拟机的网关详情。
虚拟机管理程序
虚拟机管理程序选项卡显示连接到 AWS 账户中网关的虚拟机管理程序详情。
虚拟机
虚拟机选项卡提供所有虚拟机及其与 AWS 账户中所有虚拟机管理程序连接的相关详情列表。
