阿里云 HBase 监控集成
Site24x7 为部署在阿里云环境中的 HBase 提供开箱即用的全面监控。深入了解请求处理、存储文件性能、块缓存效率和服务器健康状况,帮助您维持快速、可靠且可扩展的 NoSQL 操作。将阿里云账户与 Site24x7 集成后,所有关联的 HBase 实例将自动发现并持续监控。
使用场景
- 查询延迟跟踪:监控读写请求数量及平均延迟,识别性能瓶颈。
- 存储洞察:了解存储文件大小、内存占用和刷新行为,优化存储性能。
- 缓存效率:衡量块缓存命中/未命中次数,提升读取性能。
- 服务器健康:监控 Region Server 数量、队列大小和异常情况,确保 HBase 可用性。
- GC 与内存分析:分析堆内存和垃圾回收时间,管理内存泄漏或内存峰值问题。
设置与配置
- 登录您的 Site24x7 账户,导航至云服务 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面,从服务类型列表中选择 HBase。
- 添加完成后,进入云服务 > 阿里云 > HBase,查看仪表板和性能指标。
支持的指标
请求指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 读取请求数(操作次数) | HBase 处理的读取操作次数。 | 次 |
| 写入请求数(操作次数) | HBase 处理的写入操作次数。 | 次 |
| Put 请求延迟(平均值) | Put(写入)请求的平均延迟。 | 毫秒 |
| Get 请求延迟(平均值) | Get(读取)请求的平均延迟。 | 毫秒 |
| Append 操作次数 | 执行的 Append 操作次数。 | 次 |
| 慢速 Get 请求数 | 被认为响应缓慢的 Get 请求次数。 | 次 |
| 慢速 Put 请求数 | 被认为响应缓慢的 Put 请求次数。 | 次 |
| 慢速 Append 请求数 | 被认为响应缓慢的 Append 请求次数。 | 次 |
| 刷新时间(平均值) | 刷新操作的平均耗时(纳秒)。 | 纳秒 |
| 刷新时间 | 最近一次刷新操作的耗时。 | 毫秒 |
存储指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 存储文件数 | HBase 中存储文件的数量。 | 个 |
| 存储文件大小 | 所有存储文件的总大小。 | 字节 |
| 存储文件索引大小 | 存储文件索引的总大小。 | 字节 |
| MemStore 大小 | 当前 MemStore 中的数据量。 | 字节 |
| 刷新队列大小 | 刷新队列的大小。 | 个 |
| 存储文件未压缩大小 | 存储文件的总未压缩大小。 | 字节 |
块缓存指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 块缓存命中次数 | 块缓存命中的成功次数。 | 次 |
| 块缓存未命中次数 | 读取过程中块缓存未命中的次数。 | 次 |
| 块缓存块数 | 缓存中的块总数。 | 个 |
| 块缓存大小 | 块缓存的总大小。 | 字节 |
| 块缓存空闲空间 | 块缓存中的可用空间量。 | 字节 |
系统 — Region Server
| 指标名称 | 说明 | 单位 |
|---|---|---|
| Region Server 数量 | 存活的 Region Server 数量。 | 个 |
| 宕机 Region Server 数量 | 宕机的 Region Server 数量。 | 个 |
| Region 数量 | 集群管理的 Region 总数。 | 个 |
| Region Server 开放连接数 | Region Server 上的开放连接数。 | 个 |
| Handler 队列大小 | Handler 队列的大小。 | 个 |
| NotServingRegion 异常数 | NotServingRegion 异常的发生次数。 | 次 |
| RegionTooBusy 异常数 | RegionTooBusy 异常的发生次数。 | 次 |
系统 — GC 与内存
| 指标名称 | 说明 | 单位 |
|---|---|---|
| GC 时间(毫秒) | 垃圾回收花费的总时间。 | 毫秒 |
| 已用堆内存 | 当前已使用的堆内存量。 | MB |
阈值配置
- 进入管理 > 配置文件 > 阈值和可用性。
- 为 HBase 创建或编辑阈值配置文件。
- 将配置文件分配给相应监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。当发生阈值突破时,告警引擎将持续检查已定义阈值的系统事件,并执行已映射的自动化操作。
- 进入管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射到监视器以实现主动解决。
配置规则
通过 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化监控资源的配置设置。在添加新的 HBase 监视器时,自动应用这些设置。
