容量规划监视器的 RCA
每次检测到中断时,系统将生成根因分析(RCA)报告,并根据告警联系人和方式发送给用户。生成的 RCA 报告提供宕机的实际原因,以及已监控资源、各资源中断情况、发生中断属性的 Top-N 监视器数据和异常情况等其他信息。
RCA 的优势
RCA 报告使您能够:
- 高效地深入分析中断的根本原因并加以解决。
- 采取措施,防止问题在未来再次发生。
使用场景
如果某个资源的 CPU 利用率超过允许的阈值限制,则问题原因及其他数据将显示在 RCA 报告中并发送给用户。这将有助于更快速地进行故障排除,并防止未来出现类似的宕机问题。
摘要
在摘要选项卡中,您可以获取显示名称、监视器类型、状态、原因、宕机时间和宕机持续时长等详细信息。
状态事件
在状态事件选项卡中,您可以获取资源在过去 24 小时内记录的事件状态。状态可能为宕机、严重、故障或维护中。
已监控资源
在此选项卡中,您可以查看映射到相应容量规划监视器的所有资源及其状态、性能和已突破的指标。假设您有 5 个资源映射到容量规划监视器,且 CPU 利用率阈值配置为 90%。如果有 2 个资源超过 90% 的 CPU 利用率阈值,则这 2 个资源的性能状态将被标记为"已突破"。有关更多详情,请参阅已监控资源文档。
中断历史
在中断历史选项卡中,您可以查看映射到容量规划监视器的资源中断详情。此选项卡中仅列出在过去 24 小时内发生过中断的监视器。
异常历史
在异常历史选项卡中,您可以查看过去 24 小时内的异常历史记录,以及针对映射到容量规划监视器的特定资源所识别出的严重程度和原因分析等其他详情。
Top-N 监视器
在 Top-N 监视器选项卡中,您可以查看突破阈值的指标对应的排名靠前的监视器。例如,如果某个监视器的 CPU 利用率和接收字节数均突破了阈值限制,则可以在两个不同的 Top-N 监视器部分中查看这些指标的排名靠前的监视器。

