腾讯云 EMR 监控集成
利用 Site24x7 腾讯云 EMR 监控集成,您可以:
- 监控 HDFS 容量利用率,防止大数据集群存储耗尽。
- 跟踪 DataNode 数量和数据块分布,保障集群健康与数据完整性。
- 观察文件总数,了解 HDFS 命名空间中的工作负载密度。
- 在 EMR 作业因存储限制而失败之前,对容量阈值发出告警。
本帮助文档包含设置腾讯云 EMR 监控集成的说明及相关信息。
设置与配置
在设置腾讯云监视器时,如果您已在 Services/Resources 下拉菜单中选择了 EMR,则所有 EMR 资源将自动被发现并监控,无需为每个资源手动创建监视器。
如果在创建腾讯云监视器时未选择 EMR,请按照以下步骤操作:
- 登录您的 Site24x7 账户。
- 前往 Cloud > Tencent Cloud,选择您的腾讯云监视器,然后前往左侧面板上的任意仪表板。
- 点击汉堡图标
并选择 Edit,进入 Edit Tencent Cloud Monitor 页面。 - 在 Edit Tencent Cloud Monitor 页面上,从 Services/Resources 下拉菜单中选择 EMR,然后点击 Save。
- 配置成功后,前往 Cloud > Tencent Cloud > EMR,即可查看已发现的资源。
数据采集频率
腾讯云 EMR 资源的性能指标默认每五分钟采集一次,并每五分钟更新至 Site24x7 门户;指标也会根据所选的轮询间隔进行采集。
支持的指标
| 指标名称 | 描述 | 单位 |
|---|---|---|
| HDFS Capacity Total | HDFS 分布式文件系统中可用的总存储容量 | GB |
| HDFS Capacity Used | 当前数据和副本占用的 HDFS 存储量 | GB |
| DataNode Count | 当前处于活跃状态并已向 NameNode 注册的 DataNode 守护进程数量 | Count |
| Total Blocks | HDFS 中所有 DataNode 上存储的数据块总数 | Count |
| Total Files | HDFS 命名空间中的文件和目录总数 | Count |
阈值配置
全局配置
- 前往左侧导航面板中的 Admin 部分。
- 从左侧面板选择 Configuration Profiles,并从下拉菜单中选择 Threshold and Availability (+) 标签页。点击右上角的 Add Threshold Profile。
- 将监视器类型设置为 Tencent Cloud EMR,即可为上述所有指标设置阈值。
监视器级别配置
- 前往 Cloud > Tencent Cloud > EMR。
- 选择您要设置阈值的资源,然后点击汉堡图标
。选择 Edit,进入 Edit Tencent Cloud EMR Monitor 页面。 - 选择 Threshold and Availability 即可为指标设置阈值。您还可以在属性级别配置 IT 自动化。
IT 自动化
Site24x7 的 IT 自动化工具有助于自动解决性能降级问题。当发生违规时,告警引擎会持续检查已定义阈值的系统事件,并执行相应的自动化操作。
配置规则
使用 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。
