帮助手册

Amazon Elastic Beanstalk 监控集成

Amazon Elastic Beanstalk 通过消除容量供应、负载均衡和扩缩容的管理开销,让您轻松部署和扩展 Web 应用程序。借助 Site24x7 的 AWS 集成,您可以收集数据以获得可见性,配置阈值,并在 Beanstalk 环境出现问题时立即收到告警。

支持

默认情况下,Site24x7 从基础健康报告系统收集信息以确定环境健康状况。此外,您还可以为环境启用增强型报告,或更新健康报告偏好设置,将系统级和应用程序级指标发布到 CloudWatch,以便通过 Site24x7 进行跟踪。

设置与配置

  • 如果尚未完成,请通过将 Site24x7 创建为 IAM 用户或 IAM 角色来启用对 AWS 资源和服务的访问。了解更多。
  • 接下来,在集成您的 AWS 账户部分,请确保在待发现服务字段中勾选了 ElasticBeanstalk 复选框。了解更多。

策略与权限

请确保分配给 Site24x7 实体的 IAM 策略中包含以下只读操作。了解更多。

  • "elasticbeanstalk:DescribeEnvironmentResources",
  • "elasticbeanstalk:DescribeAccountAttributes",
  • "elasticbeanstalk:DescribeEnvironments",
  • "elasticbeanstalk:DescribeEvents",
  • "elasticbeanstalk:DescribeInstancesHealth",
  • "elasticbeanstalk:DescribeEnvironmentHealth",
  • "elasticbeanstalk:DescribeConfigurationSettings",
  • "elasticbeanstalk:ListTagsForResource",
  • "cloudformation:ListStackResources",
  • "autoscaling:DescribeAutoScalingGroups",
  • "autoscaling:DescribeAccountLimits",
  • "autoscaling:DescribeLaunchConfigurations",
  • "s3:ListAllMyBuckets",
  • "s3:GetObject",
  • "s3:GetObjectAcl",
  • "s3:GetObjectVersion",
  • "s3:GetObjectVersionAcl",
  • "s3:GetBucketLocation",
  • "s3:GetBucketPolicy",
  • "s3:ListBucket"

更新环境的健康偏好设置

如果您使用最新平台版本创建了环境,则默认情况下已启用增强型健康报告。但是,要使用 Site24x7 记录和跟踪环境及系统级指标,您需要将 Elastic Beanstalk 服务收集的数据作为自定义指标发布到 CloudWatch:

要选择要为环境监控的指标,请按以下步骤操作:

  • 登录 Elastic Beanstalk 控制台,导航到您的环境管理页面
  • 选择配置,然后在监控配置卡片上选择修改
  • 健康报告下,增强型选项已默认选中。
  • 使用 Ctrl/Command 键可多选指标
  • 选择应用
注意

默认情况下不会选择任何指标,您需要选择指标以在 Site24x7 控制台中生成预配置的时间序列图表。此外,CloudWatch 对自定义指标收费,适用于除"环境健康"以外的所有指标。

阈值违规告警

编辑阈值配置文件页面,将以下阈值切换为以接收通知:

  • 被监控资源处于宕机/严重/警告状态
  • 发生环境健康故障
  • 出现环境健康状态警告
  • 平台分支状态已弃用或已退役

轮询间隔

Site24x7 按照设置的轮询频率(1 分钟至 1 天)收集性能统计信息、健康状态和资产数据。了解更多。

IT 自动化

您可以为 Site24x7 支持的 AWS 服务添加自动化。登录 Site24x7,转到管理 > IT 自动化模板 (+) > 添加自动化模板。添加自动化后,您可以按顺序调度执行

您现在可以使用 Amazon Elastic Beanstalk 服务自动化重启 Beanstalk 环境中运行的 Web 服务器。

许可

支持的指标

环境级别数据

属性 描述 数据类型 统计
环境健康 显示环境健康状态 – 0(正常)、1(信息)、5(未知)、10(无数据)、15(警告)、20(降级)和 25(严重) 计数 求和
正常实例数 统计处于正常健康状态的实例数量 计数 求和
待处理实例数 统计处于待处理健康状态的实例数量 计数 求和
信息状态实例数 统计处于信息健康状态的实例数量 计数 求和
未知状态实例数 统计处于未知健康状态的实例数量 计数 求和
无数据实例数 统计处于无数据健康状态的实例数量 计数 求和
警告状态实例数 统计处于警告健康状态的实例数量 计数 求和
降级实例数 统计处于降级健康状态的实例数量 计数 求和
严重状态实例数 统计处于严重健康状态的实例数量。 计数 求和

实例级别数据

属性 描述 数据类型 统计
1 分钟负载平均值 统计过去一分钟的平均 CPU 负载 计数 平均值
实例健康 统计实例的健康状态 计数 最大值
根文件系统使用率 统计已使用的磁盘空间百分比。 百分比 平均值
CPU 硬件中断 统计 CPU 处理硬件中断所花费的时间百分比。 百分比 平均值
CPU 用户态 统计 CPU 在用户态执行所花费的时间百分比。 百分比 平均值 
CPU 空闲 统计 CPU 处于空闲状态的时间百分比 百分比 平均值
CPU 系统态 统计 CPU 在系统(内核)态执行所花费的时间百分比。 百分比 平均值
CPU 软中断 统计 CPU 处理软件中断所花费的时间百分比。 百分比 平均值
CPU I/O 等待 统计 CPU 在有未完成磁盘 I/O 请求时处于空闲状态的时间百分比。 百分比 平均值
CPU Nice 统计 CPU 运行正 NICE 值进程的时间百分比。 百分比 平均值
属性 描述 数据类型 统计
应用程序请求总数 统计实例或环境已完成的请求数 计数 求和
应用程序 2xx 请求数 统计以 2xx 代码完成的请求数 计数 求和
应用程序 3xx 请求数 统计以 3xx 代码完成的请求数 计数 求和
应用程序 4xx 请求数 统计以 4xx 代码完成的请求数 计数 求和
应用程序 5xx 请求数 统计以 5xx 代码完成的请求数 计数 求和
应用程序延迟 P10 统计完成最快 10% 请求所需的平均时间 平均值
应用程序延迟 P50 统计完成最快 50% 请求所需的平均时间 平均值
应用程序延迟 P75 统计完成最快 75% 请求所需的平均时间 平均值
应用程序延迟 P85 统计完成最快 85% 请求所需的平均时间 平均值
应用程序延迟 P90 统计完成最快 90% 请求所需的平均时间 平均值
应用程序延迟 P95 统计完成最快 95% 请求所需的平均时间 平均值
应用程序延迟 P99 统计完成最快 99% 请求所需的平均时间 平均值
应用程序延迟 P99.9 统计完成最快 X% 请求所需的平均时间 平均值

查看数据

  • 登录 Site24x7 控制台,单击 AWS > 已监控的 AWS 账户,然后从下拉菜单中选择 Elastic Beanstalk。
  • 从已监控的环境列表中,选择要查看指标的环境。
  • 应用程序健康状况的各种图表将显示在摘要选项卡中。

Elastic Beanstalk 监控 UI 页面

摘要

使用 Site24x7 的 Elastic Beanstalk 摘要选项卡,更好地了解应用程序健康状况。默认情况下,会显示环境健康概览和实例健康小组件,以及事件严重性计数的图表。 

实例

Site24x7 的实例选项卡可以近实时地展示为 Web 应用程序提供支撑的 Amazon EC2 实例的健康状况。默认情况下不显示任何图表。请更新 Elastic Beanstalk 设置,选择要监控的实例指标,以在 Site24x7 UI 中生成指标。

自动扩缩容

了解 AutoScaling 何时从您的 AutoScaling 组启动或终止 EC2 实例。查看启动配置详情以及扩缩容事件和描述,将环境健康状况与变更进行对比以确定根本原因。

已监控资源

在此您可以查看与 Elastic Beanstalk 环境关联的已监控 EC2 实例、弹性负载均衡节点和 SQS 队列的列表。单击某个条目可查看与该资源关联的性能和资源使用统计信息。您还可以通过单击操作下的铅笔图标来设置阈值,并在任何这些服务发生故障时收到通知。

事件

我们的 Elastic Beanstalk 监控事件页面显示平台生成或您的应用程序环境发出的所有事件和通知列表。您可以随时查看最近生成的 100 个事件。

配置详情

获取 Elastic Beanstalk 环境的完整配置概览。查看每个资源的配置信息,包括 EC2 实例、AutoScaling 组、实例安全组、负载均衡器、负载均衡器安全组等。

拓扑视图

拓扑视图选项卡提供实时的、以资源为中心的依赖关系图。它动态追踪您的 Elastic Beanstalk 资源与周边 AWS 基础架构的实时连接关系,在告警触发时能够更快速地进行根因隔离。如果任何连接的组件处于严重状态,将在拓扑视图中相应标记,并显示中断原因,让您无需离开监视器页面即可精确定位故障点。与全账户范围的拓扑视图不同,此选项卡将可视化范围限定于单个资源,精确回答以下问题:此 Elastic Beanstalk 资源连接了哪些内容,一旦故障会影响什么?您可以从单个资源向上追踪完整的依赖链,直至其主要父级实体、服务类型、区域和 AWS 账户级别。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!