使用 Site24x7 避免 AWS 环境中断

2023-02-01

AWS 服务过去曾面临多次中断,这些中断的影响在科技界众所周知。在这种情况下,多项 AWS监控 服务会受到影响,从而极大地影响客户和企业。当关键业务应用程序托管在 AWS 上时,企业有必要采用万无一失的方法来避免中断。中断可能是企业制定业务连续性计划和实施解决方案以监控 AWS 健康状况的警钟。

AWS 健康仪表板

Amazon Web Services 的 AWS Health Dashboard 可让您实时了解 AWS 资源、服务和账户的状态。它提供个性化通信,通知您潜在的 AWS 资源性能或可用性问题,并提供补救建议。AWS 运行状况监控器会在 AWS 资源的运行状况发生变化时发出警报,包括计划的维护事件或不可预见的 AWS 中断。

AWS Health Dashboard 是 AWS Health 服务的一项功能,可向您发送主动通知、汇总 AWS 组织的健康事件、通过 IAM 控制访问并提供详细的故障排除指南。例如,如果存在影响您的一个 Amazon Elastic Block Store (EBS) 卷的硬件问题,来自 AWS Health Dashboard 的警报会提供受影响资源的列表、建议的操作以及恢复您的卷的帮助链接。使用这些警报,您可以减少平均修复时间 (MTTR)。

Site24x7 和 AWS Health Dashboard

Site24x7 与 AWS Health Dashboard 的集成为您提供了一个统一的平台来查看和识别影响您的 AWS 资源的事件和问题。通过 Site24x7 的 AWS Health Dashboard 集成,您可以在 AWS 中断期间深入了解您的 AWS 服务和账户。

服务可用性

AWS Health Dashboard 允许您为 AWS 区域中的服务可用性创建事件。例如,与 Site24x7 集成后,您将收到事件通知。您可以查看事件描述以了解问题、确定任何受影响的资源并采取任何建议的操作以确保您的 AWS 资源不受影响。

健康监测器

AWS Health Dashboard 允许您跟踪资源的可用性,并根据区域、服务和事件类型等类别查看过去的健康事件数量。您可以分析运行状况事件如何影响您的 AWS 资源,并通过使用高级设置配置通知来管理事件。Site24x7 中的 IT 自动化功能允许您配置阈值并接收受影响资源的警报。

与 AWS Health Dashboard 集成后,Site24x7 提供以下三个监视器来查看和识别影响您的 AWS 资源的事件和问题:

问题:此监视器可帮助您识别问题类别下的运行状况事件。此类别中的常见事件包括有关导致服务降级的操作问题或您需要了解的本地化资源级别问题的通信。

AccountNotification:此监视器向您发送健康事件通知,包括证书轮换、账单通知和安全漏洞。

ScheduledChange:此监视器通知您即将发生的事件,这些事件提供有关资源更改的信息。

Site24x7 的 AWS Health Dashboard 监控器可供所有 Site24x7 订阅持有者使用,包括付费用户和评估用户。通过主动监控您的所有服务来保护您的 AWS 服务,以弹性方式运营您的业务。对于 AWS Health Dashboard 集成,请参阅我们的文档。要了解有关 AWS 监控功能的更多信息,请访问 Site24x7。