帮助手册

阿里云 HBase 监控集成

Site24x7 为部署在阿里云环境中的 HBase 提供开箱即用的全面监控。深入了解请求处理、存储文件性能、块缓存效率和服务器健康状况,帮助您维持快速、可靠且可扩展的 NoSQL 操作。将阿里云账户与 Site24x7 集成后,所有关联的 HBase 实例将自动发现并持续监控。

使用场景

  • 查询延迟跟踪:监控读写请求数量及平均延迟,识别性能瓶颈。
  • 存储洞察:了解存储文件大小、内存占用和刷新行为,优化存储性能。
  • 缓存效率:衡量块缓存命中/未命中次数,提升读取性能。
  • 服务器健康:监控 Region Server 数量、队列大小和异常情况,确保 HBase 可用性。
  • GC 与内存分析:分析堆内存和垃圾回收时间,管理内存泄漏或内存峰值问题。

设置与配置

  • 登录您的 Site24x7 账户,导航至云服务 > 阿里云 > 添加监视器
  • 编辑阿里云监视器页面,从服务类型列表中选择 HBase
  • 添加完成后,进入云服务 > 阿里云 > HBase,查看仪表板和性能指标。

支持的指标

请求指标

指标名称说明单位
读取请求数(操作次数) HBase 处理的读取操作次数。
写入请求数(操作次数) HBase 处理的写入操作次数。
Put 请求延迟(平均值) Put(写入)请求的平均延迟。 毫秒
Get 请求延迟(平均值) Get(读取)请求的平均延迟。 毫秒
Append 操作次数 执行的 Append 操作次数。
慢速 Get 请求数 被认为响应缓慢的 Get 请求次数。
慢速 Put 请求数 被认为响应缓慢的 Put 请求次数。
慢速 Append 请求数 被认为响应缓慢的 Append 请求次数。
刷新时间(平均值) 刷新操作的平均耗时(纳秒)。 纳秒
刷新时间 最近一次刷新操作的耗时。 毫秒

存储指标

指标名称说明单位
存储文件数 HBase 中存储文件的数量。
存储文件大小 所有存储文件的总大小。 字节
存储文件索引大小 存储文件索引的总大小。 字节
MemStore 大小 当前 MemStore 中的数据量。 字节
刷新队列大小 刷新队列的大小。
存储文件未压缩大小 存储文件的总未压缩大小。 字节

块缓存指标

指标名称说明单位
块缓存命中次数 块缓存命中的成功次数。
块缓存未命中次数 读取过程中块缓存未命中的次数。
块缓存块数 缓存中的块总数。
块缓存大小 块缓存的总大小。 字节
块缓存空闲空间 块缓存中的可用空间量。 字节

系统 — Region Server

指标名称说明单位
Region Server 数量 存活的 Region Server 数量。
宕机 Region Server 数量 宕机的 Region Server 数量。
Region 数量 集群管理的 Region 总数。
Region Server 开放连接数 Region Server 上的开放连接数。
Handler 队列大小 Handler 队列的大小。
NotServingRegion 异常数 NotServingRegion 异常的发生次数。
RegionTooBusy 异常数 RegionTooBusy 异常的发生次数。

系统 — GC 与内存

指标名称说明单位
GC 时间(毫秒) 垃圾回收花费的总时间。 毫秒
已用堆内存 当前已使用的堆内存量。 MB

阈值配置

  1. 进入管理 > 配置文件 > 阈值和可用性
  2. HBase 创建或编辑阈值配置文件。
  3. 将配置文件分配给相应监视器以触发告警。

IT 自动化

Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。当发生阈值突破时,告警引擎将持续检查已定义阈值的系统事件,并执行已映射的自动化操作。

  1. 进入管理 > IT 自动化模板
  2. 创建新的自动化规则。
  3. 将规则映射到监视器以实现主动解决。

如何为监视器配置 IT 自动化

配置规则

通过 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。在添加新的 HBase 监视器时,自动应用这些设置。

如何添加配置规则

相关链接

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!