Amazon Elastic Container Registry 监控
Amazon Elastic Container Registry(ECR)是一个完全托管的 Docker 容器注册表,允许您安全地存储、管理和部署容器镜像。它支持用于托管和共享容器镜像的私有和公有存储库。
概述
Site24x7 与 Amazon ECR 的集成会自动发现您的容器存储库并创建两个专用监视器:
- ECR 私有存储库监视器:跟踪用于内部部署的私有存储库。它监控存储库拉取次数、存储库推送镜像次数、已标记镜像数量和未标记镜像数量等指标。这有助于确保私有容器镜像的安全性、及时更新和成本效益。
- ECR 公有存储库监视器:专注于公开共享的存储库。它监控存储库推送镜像次数、已标记镜像数量和未标记镜像数量,以深入了解存储库的受欢迎程度和资源消耗情况。
通过此集成,您可以在一处可视化和分析存储库指标、接收异常告警,并确保容器镜像注册表的最佳性能。
使用场景
示例 1
- 一个 DevOps 团队使用 Amazon ECR 中的私有和公有存储库管理多个容器化应用程序。随着时间推移,他们注意到部署期间出现意外延迟和存储成本上升,但无法找出原因。
- 启用 Site24x7 与 Amazon ECR 的集成后,团队为 ECR 私有和公有存储库设置了监控。使用 ECR 私有存储库监视器,团队跟踪了镜像数量和标签增长情况,帮助识别了占用存储空间的未使用或过时镜像。
- 与此同时,ECR 私有存储库监视器显示某些地区的拉取活动量很高,促使团队优化了复制规则和缓存配置。当复制规则被禁用时,Site24x7 的告警通知了团队,帮助在部署失败发生之前恢复了同步。通过在一处整合可视性、告警和性能指标,团队减少了部署问题,有效管理了存储成本,并维护了安全可靠的容器镜像工作流程。
示例 2
- 一个云运营团队管理跨多个 AWS 地区和账户的容器化应用程序。该团队依靠 Amazon ECR 仅存储私有存储库镜像,并配置了复制和缓存以确保快速部署和一致更新。
- 拉取缓存告警:某个存储库配置了拉取缓存规则以加速从外部注册表拉取镜像。当该规则被禁用或离开活动状态时,Site24x7 会通知团队。得益于及时的告警,团队迅速重新启用缓存或执行手动拉取,防止镜像更新延迟并避免潜在的部署失败。
- 复制规则告警:另一个存储库将镜像跨多个地区复制以实现高可用性。如果复制规则被删除或禁用,Site24x7 会提醒团队。这一早期通知有助于在任何地区出现镜像缺失之前恢复复制,从而防止数据不一致和部署中断。
- 通过接收这些告警,团队维持了顺畅的部署,确保了各地区之间的镜像一致性,并避免了因缓存或复制问题导致的延迟。
Site24x7 Amazon ECR 集成的优势
将您的 Amazon ECR 环境与 Site24x7 集成,并充分利用以下优势:
- 全面的存储库监控:对 ECR 私有和公有存储库进行统一监控。
- 自动发现:自动识别并添加存储库以进行持续跟踪。
- 实时指标:获取镜像数量、大小以及存储库拉取和推送活动的实时数据。
- 告警与报表:获取有关拉取缓存和复制禁用的通知。
设置与配置
- 登录您的 Site24x7 账户。
- 转到云服务 > AWS > 集成 AWS 账户,并创建跨账户 IAM 角色,以向 Site24x7 提供访问 AWS 资源的权限。
- 在集成 AWS 账户页面上,根据您的需求从待发现的服务列表中选择 Elastic Container Registry(ECR)。
权限
确保 Site24x7 获得以下权限以监控 Amazon ECR:
- "ecr:DescribeRepositories"
- "ecr:ListTagsForResource"
- "ecr:DescribeImages"
- "ecr:DescribeRegistry"
- "ecr:DescribePullThroughCacheRules"
- "ecr:GetRepositoryPolicy"
- "ecr:GetLifecyclePolicy"
- "ecr:GetLifecyclePolicyPreview"
- "ecr-public:DescribeRepositories"
- "ecr-public:DescribeImages"
- "ecr-public:ListTagsForResource"
- "ecr-public:GetRepositoryPolicy"
轮询频率
Site24x7 按照设定的轮询频率(从每分钟一次到每天一次)查询 AWS 服务级别 API,以收集 Amazon ECR 监视器的指标。
支持的指标
以下是 Amazon ECR 监视器支持的指标。
ECR 私有存储库
| 指标名称 | 描述 | 统计 | 单位 |
|---|---|---|---|
| Repository Pull Count | 存储库中镜像的总拉取次数。 | Sum | Count |
| Repository Push Count | 存储库中镜像的总推送次数。 | Sum | Count |
| Image Count | 存储库中的镜像总数。 | Sum | Count |
| Untagged Image Count | 存储库中未标记镜像的总数。 | Sum | Count |
| Tagged Image Count | 存储库中已标记镜像的总数。 | Sum | Count |
| Repository Storage | 存储库中镜像的总存储量。 | Average | MB |
ECR 公有存储库
| 指标名称 | 描述 | 统计 | 单位 |
|---|---|---|---|
| Repository Push Count | 存储库中镜像的总推送次数 | Sum | Count |
| Image Count | 存储库中的镜像总数 | Sum | Count |
| Untagged Image Count | 存储库中未标记镜像的总数 | Sum | Count |
| Tagged Image Count | 存储库中已标记镜像的总数 | Sum | Count |
| Repository Storage | 存储库中镜像的总存储量 | Average | MB |
阈值配置
为 ECR 监视器配置阈值:
- 登录您的 Site24x7 账户,导航至管理 > 配置文件 > 阈值和可用性。
- 单击添加阈值配置文件。
- 从监视器类型下拉菜单中选择适用的监视器类型。可用的监视器类型为 ECR 私有存储库和 ECR 公有存储库。
- 在显示名称字段中输入合适的名称。
- 支持的指标将显示在阈值配置部分。您可以为上述所有指标设置阈值。
- 单击保存。
授权许可
- 每个 ECR 私有存储库使用一个基础监视器许可证。
- 每个 ECR 公有存储库监视器使用一个基础监视器许可证。
查看 Amazon ECR 数据
要监控您的 Amazon ECR 环境,请登录您的 Site24x7 账户并导航至云服务 > AWS > ECR 私有存储库或 ECR 公有存储库。
监视器数据
以下是每个 Amazon ECR 监视器的监视器数据。
ECR 私有存储库
您可以在以下选项卡中查看 ECR 私有存储库监视器数据:
摘要
摘要选项卡以图表形式提供事件时间线和指标的概述。
镜像
镜像选项卡显示存储库中的镜像。您可以查看镜像标签、推送时间、镜像大小、镜像摘要和上次拉取时间等详细信息。
权限
权限选项卡显示存储库已启用的所有权限。
生命周期策略
生命周期策略选项卡显示与存储库关联的所有生命周期策略。您可以查看策略优先级、描述、标签状态和标签筛选条件等详细信息。受影响镜像数列显示生命周期策略将影响的镜像数量(基于预览,如有)。
中断
中断选项卡提供中断的开始时间、结束时间、持续时间和备注(如有)的详细信息。
清单
清单选项卡显示存储库名称、地区和监视器许可类别等详细信息。您还可以在此选项卡中设置和查看阈值和可用性配置文件以及通知配置文件。
日志报表
此选项卡提供 ECR 私有存储库监视器日志状态的综合报表,可下载为 CSV 文件。
告警日志
此选项卡按时间顺序显示与 ECR 私有存储库监视器相关的所有已触发告警列表。此选项卡帮助您追踪告警历史记录和严重程度,以评估问题并验证阈值设置。
ECR 公有存储库
您可以在以下选项卡中查看 ECR 公有存储库监视器数据:
摘要
摘要选项卡以图表形式提供事件时间线和指标的概述。
镜像
镜像选项卡显示存储库中的镜像。您可以查看镜像标签、推送时间、镜像大小和镜像摘要等详细信息。
权限
权限选项卡显示存储库已启用的所有权限。
中断
中断选项卡提供中断的开始时间、结束时间、持续时间和备注(如有)的详细信息。
清单
从清单选项卡获取存储库名称、地区和监视器许可类别等详细信息。在此选项卡中根据用户设置和查看阈值和可用性配置文件以及通知配置文件。
日志报表
此选项卡提供 ECR 公有存储库监视器日志状态的综合报表,可下载为 CSV 文件。
告警日志
此选项卡按时间顺序显示与 ECR 公有存储库监视器相关的所有已触发告警列表。此选项卡帮助您追踪告警历史记录和严重程度,以评估问题并验证阈值设置。
