AWS Health 监控集成
AWS Health 为您提供有关 AWS 资源、服务和账户状态的实时信息。该服务会通知您可能影响 AWS 资源的资源性能或可用性问题,并提供修复建议。AWS Health 监视器在 AWS 资源健康状态发生变化时(包括计划维护事件或意外中断)提供告警,帮助您更好地了解情况并指导故障排除。

使用场景
- AWS Health 代表其他 AWS 服务创建事件,这些事件会通知您即将发生或已计划的可能影响您账户的变更。例如,如果 AWS Identity and Access Management(IAM)计划弃用某个托管策略,或 AWS Config 计划弃用某个托管规则,AWS Health 可以创建相应的事件。在这种情况下,如果您的账户已与 Site24x7 集成,您将收到该特定事件的通知告警,从而可以根据事件采取必要措施。
- 当 AWS 区域发生服务可用性问题时,AWS Health 也会创建事件。如果您的账户已与 Site24x7 集成,您将收到事件通知告警。您可以查看事件描述以了解问题,识别受影响的资源,并采取建议的操作,确保您的 AWS 资源不受影响。
Site24x7 与 AWS Health 集成的优势
Site24x7 与 AWS Health 的集成为您提供统一平台,以查看和识别影响 AWS 资源的事件和问题。
通过 Site24x7 与 AWS Health 的集成,您可以:
- 深入了解您的 AWS 服务和账户。
- 跟踪资源可用性,并按区域、服务和事件类型等分类查看健康事件数量。
- 分析健康事件对 AWS 资源的影响并进行管理。
- 使用高级设置为健康事件配置通知。
- 配置阈值,并对受影响的资源收到告警。
设置和配置
- 如果尚未完成,请通过在您的账户与 Site24x7 的 AWS 账户之间创建跨账户 IAM 角色,启用对 AWS 资源的访问权限。了解更多。
- 在集成 AWS 账户页面上,请确保在要发现的服务字段中选中了 AWS Health。了解更多。
策略和权限
确保 Site24x7 监控 AWS 资源健康状况所需的以下权限已设置:
- "health:DescribeAffectedEntities"
- "health:DescribeEventAggregates"
- "health:DescribeEventDetails"
- "health:DescribeEvents"
- 使用 Business、Enterprise On-Ramp 或 Enterprise 支持计划的 AWS 账户
轮询频率
AWS Health 监控的指标数据默认以五分钟的轮询频率收集。
支持的 AWS Health 指标
以下指标适用于区域、服务和事件类型级别。指标的可用性也取决于事件类别。例如,问题事件监视器不包含即将发生的事件指标。
| 指标名称 | 描述 | 单位 |
|---|---|---|
| 待处理事件 | 状态为"待处理"的健康事件数量 | Count |
| 即将发生的事件 | 状态为"即将发生"的健康事件数量 | Count |
| 已关闭事件 | 状态为"已关闭"的健康事件数量 | Count |
| 事件总数 | 捕获的事件总数 | Count |
阈值配置
依次进入管理 > 配置文件 > 阈值与可用性(+),选择 AWS Health 作为监视器类型。您可以为上述所有指标设置阈值,并通过切换公共事件通知和账户事件通知选项来配置接收通知。
按状态"待处理"的按区域公共事件指标按区域触发事件告警。例如,假设您将按状态"待处理"的按区域公共事件指标配置为在有超过两个待处理事件时创建告警。如果您收到两个健康事件,一个来自 us-east-1,另一个来自 us-east-2,则不会触发告警,因为这两个事件将被视为两个区域各一个待处理事件。但是,如果您又收到来自 us-east-1 的两个健康事件,则会收到告警,因为 us-east-1 区域现在有三个待处理事件。
您还可以在区域选项卡中为各个区域配置按状态"待处理"的按区域公共事件指标的阈值。同样的逻辑也适用于按状态"待处理"的按服务公共事件指标。
许可证
- 每个 AWS Health 监视器均视为基本监视器。
查看 AWS Health
若要查看 AWS 资源的健康状况,请登录您的 Site24x7 账户,导航至云 > AWS > AWS Health。
Site24x7 与 AWS Health 的集成提供以下三种监视器,用于查看和识别影响 AWS 资源的事件和问题:
- accountNotification:监控所有账户通知健康事件,如证书轮换、账单通知和安全漏洞。
- issues:所有问题类别的健康事件均由 issues 监视器监控。此类别中的常见事件包括关于导致服务降级的运营问题或您需要了解的本地化资源级别问题的通信。
- scheduledChange:scheduledChange 监控计划变更类别下的所有健康事件。这些事件提供有关即将对您的服务和资源进行变更的信息。
AWS Health 数据
您可以在以下选项卡中查看 AWS 资源的健康数据:
摘要
摘要选项卡提供基于事件状态的事件图表概览。在这里,您可以查看事件类型、待处理事件、即将发生的事件和已发生事件总数。例如,假设您的某个 AWS 资源发生了健康事件问题,issues 监视器上的待处理事件计数将更新为最新数量,以便您了解变化情况。
正在进行的事件
正在进行的事件选项卡显示当前事件,包括可能影响您 AWS 资源的待处理事件和即将发生的事件。
受监控的受影响资源
受监控的受影响资源选项卡显示所有既是受监控资源又是受影响资源的内容。例如,如果 EC2 实例监视器受到健康事件的影响,且该监视器也在 Site24x7 中被监控,则 EC2 实例监视器将列在受监控的受影响资源选项卡下。
区域
区域选项卡提供事件发生所在 AWS 资源区域的详细信息。
服务
服务选项卡显示受事件影响的 AWS 服务的详细信息。
事件历史
事件历史选项卡显示过去发生的所有事件的历史记录。
