帮助手册

腾讯云 EMR 监控集成

利用 Site24x7 腾讯云 EMR 监控集成,您可以:

  • 监控 HDFS 容量利用率,防止大数据集群存储耗尽。
  • 跟踪 DataNode 数量和数据块分布,保障集群健康与数据完整性。
  • 观察文件总数,了解 HDFS 命名空间中的工作负载密度。
  • 在 EMR 作业因存储限制而失败之前,对容量阈值发出告警。

本帮助文档包含设置腾讯云 EMR 监控集成的说明及相关信息。

设置与配置

在设置腾讯云监视器时,如果您已在 Services/Resources 下拉菜单中选择了 EMR,则所有 EMR 资源将自动被发现并监控,无需为每个资源手动创建监视器。

如果在创建腾讯云监视器时未选择 EMR,请按照以下步骤操作:

  • 登录您的 Site24x7 账户
  • 前往 Cloud > Tencent Cloud,选择您的腾讯云监视器,然后前往左侧面板上的任意仪表板。
  • 点击汉堡图标 并选择 Edit,进入 Edit Tencent Cloud Monitor 页面。
  • Edit Tencent Cloud Monitor 页面上,从 Services/Resources 下拉菜单中选择 EMR,然后点击 Save
  • 配置成功后,前往 Cloud > Tencent Cloud > EMR,即可查看已发现的资源。

数据采集频率

腾讯云 EMR 资源的性能指标默认每五分钟采集一次,并每五分钟更新至 Site24x7 门户;指标也会根据所选的轮询间隔进行采集。

支持的指标

指标名称描述单位
HDFS Capacity Total HDFS 分布式文件系统中可用的总存储容量 GB
HDFS Capacity Used 当前数据和副本占用的 HDFS 存储量 GB
DataNode Count 当前处于活跃状态并已向 NameNode 注册的 DataNode 守护进程数量 Count
Total Blocks HDFS 中所有 DataNode 上存储的数据块总数 Count
Total Files HDFS 命名空间中的文件和目录总数 Count

阈值配置

全局配置

  • 前往左侧导航面板中的 Admin 部分。
  • 从左侧面板选择 Configuration Profiles,并从下拉菜单中选择 Threshold and Availability (+) 标签页。点击右上角的 Add Threshold Profile
  • 将监视器类型设置为 Tencent Cloud EMR,即可为上述所有指标设置阈值。

监视器级别配置

  • 前往 Cloud > Tencent Cloud > EMR
  • 选择您要设置阈值的资源,然后点击汉堡图标 。选择 Edit,进入 Edit Tencent Cloud EMR Monitor 页面。
  • 选择 Threshold and Availability 即可为指标设置阈值。您还可以在属性级别配置 IT 自动化

IT 自动化

Site24x7 的 IT 自动化工具有助于自动解决性能降级问题。当发生违规时,告警引擎会持续检查已定义阈值的系统事件,并执行相应的自动化操作。

如何为监视器配置 IT 自动化

配置规则

使用 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。

如何添加配置规则

相关链接:

如何添加腾讯云监视器。
受监控的腾讯云服务类型列表。
如何为监视器配置 IT 自动化。
如何添加配置规则。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!