帮助手册

EC2 Auto Scaling 组监控集成

Amazon EC2 Auto Scaling 可根据应用程序工作负载的变化需求对实例进行扩展。Auto Scaling 组是为了实现扩展而将 EC2 实例组合在一起的逻辑集合。借助 Site24x7,您可以在组级别监控 CPU 使用率等资源利用率指标,并根据告警做出明智的决策,以配置扩展策略。

管理 EC2 Auto Scaling 组

设置和配置

1. 如果尚未完成,请通过以下方式之一启用您的 AWS 账户与 Site24x7 AWS 账户之间的资源访问权限:

  • 将 Site24x7 创建为 IAM 用户
  • 创建跨账户 IAM 角色。了解更多

2. 在集成 AWS 账户页面上,勾选 EC2 Auto Scaling 旁边的复选框。了解更多

策略和权限

Site24x7 发现 EC2 Auto Scaling 组并收集配置信息需要以下权限。了解更多

  • "autoscaling:DescribeAccountLimits",
  • "autoscaling:DescribeScheduledActions",
  • "autoscaling:DescribeLaunchConfigurations",
  • "autoscaling:DescribeNotificationConfigurations",
  • "autoscaling:DescribeScalingActivities",
  • "autoscaling:DescribeAutoScalingGroups",
  • "autoscaling:DescribeLifecycleHooks",
  • "application-autoscaling:DescribeScalableTargets"

轮询频率

Site24x7 根据配置的轮询频率查询 AWS,以收集 EC2 Auto Scaling 性能指标。支持的最短轮询间隔为一分钟,最长为 24 小时。了解更多

支持的指标

1. 资源指标

属性 描述 统计方式 数据类型
CPU 利用率 衡量实例正在使用的已分配 CPU 单元的百分比 Average Percentage
磁盘读取操作 衡量在所有实例存储卷上完成的读取操作次数 Sum Count
磁盘写入操作 衡量在所有实例存储卷上完成的写入操作次数 Sum Count
磁盘读取字节数 衡量从所有实例存储卷读取的字节数 Sum MB
磁盘写入字节数 写入所有实例存储卷的字节数 Sum MB
网络入流量 衡量所有网络接口上接收的字节数 Sum MB
网络出流量 衡量所有网络接口上发送的字节数 Sum MB
网络入数据包 衡量所有网络接口上接收的数据包数 Sum Count
网络出数据包 衡量所有网络接口上发送的数据包数 Sum Count
状态检查失败 报告实例是否同时未通过实例状态检查和系统状态检查 Maximum Count
实例状态检查失败 报告实例是否未通过实例状态检查 Maximum Count
系统状态检查失败 报告实例是否未通过系统状态检查 Maximum Count

2. EC2 Auto Scaling 组指标

属性 描述 统计方式 数据类型
组最小容量 Auto Scaling 组的最小容量 Minimum Count
组最大容量 Auto Scaling 组的最大容量 Maximum Count
预期容量 Auto Scaling 组尝试维护的实例数量 Maximum Count
服务中的实例数 作为 Auto Scaling 组的一部分正在运行的实例数量 Maximum Count
待处理实例数 处于待处理状态的实例数量,待处理实例尚未投入服务 Maximum Count
备用实例数 处于备用状态的实例数量,此状态的实例仍在运行但未主动提供服务 Maximum Count
终止中的实例数 正在终止过程中的实例数量 Maximum Count
实例总数 Auto Scaling 组中的实例总数 Maximum Count

Site24x7 的 EC2 Auto Scaling 组监控界面

摘要

通过时间序列图表全面了解各组内发生的不同进程,图表提供中断事件时间线、CPU 利用率、网络流量、网络数据包活动、磁盘 I/O 操作活动、磁盘 I/O 字节活动以及组的状态检查。

配置

此选项卡下提供组的配置详情,包括预期容量、组最大容量、组最小容量、可用区、健康检查类型、健康检查宽限期、实例保护、终止策略、服务关联角色等信息。

EC2 实例

此选项卡下显示该特定组下 EC2 实例的元数据信息。您还可以通过点击操作下的铅笔图标,设置阈值并在任一实例故障时收到通知。

拓扑视图

拓扑视图选项卡提供以资源为中心的实时依赖关系图。它动态追踪您的 EC2 Auto Scaling 资源与周边 AWS 基础设施的实时连接关系,帮助在告警触发时快速定位根本原因。如果任何连接组件处于严重状态,将在拓扑视图中相应标注,并显示中断原因,让您无需离开监视器页面即可精确定位故障点。与账户级别的拓扑视图不同,此选项卡将可视化范围限定在单个资源,直接回答这个问题:此资源连接了哪些内容,如果它出现故障会影响什么?您可以从单个资源追踪完整的依赖链,直至其主要父实体、服务类型、区域和 AWS 账户级别。

预测

预估以下性能指标的未来值,为增加容量或扩展 AWS 基础设施做出明智决策。

  • CPU 利用率
  • 网络入流量
  • 网络出流量

活动历史

此选项卡描述了在组内执行的扩展操作的活动历史。

扩展策略

提供包含策略名称、策略类型及相应详情的扩展策略信息。

通知

此选项卡显示执行的扩展操作类型及其相应的通知。

计划操作

此选项卡显示用户配置的即将进行的扩展操作,提供的详情包括操作名称、开始时间、组的最大容量和最小容量。

生命周期挂钩

Auto Scaling 生命周期挂钩允许您执行自定义操作,例如 Auto Scaling 启动或终止实例时的操作。该选项卡提供名称、心跳超时(秒)、超时(秒)、默认结果和生命周期转换等信息。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!