阿里云 ApsaraDB for MongoDB 监控集成
Site24x7 为部署在阿里云环境中的 ApsaraDB for MongoDB 实例提供开箱即用的全面监控。通过对资源利用率、缓存效率、查询性能、复制健康状态和分片活动的深度洞察,您可以优化 MongoDB 集群的可靠性和性能。将阿里云账户与 Site24x7 集成后,所有关联的 MongoDB 实例将被自动发现并持续监控。
用例
- 资源与缓存管理:监控内存和 WiredTiger 缓存使用率,防止内存饱和和缓存效率低下。
- 存储与 IOPS 优化:跟踪磁盘利用率、IOPS 消耗和带宽,避免瓶颈问题。
- 查询性能分析:深入了解 QPS、平均命令延迟以及查询/更新/删除操作情况。
- 事务监控:观察提交、中止和准备速率,以检测事务异常。
- 复制健康检查:监控复制延迟和副本操作,确保各节点间的一致性。
- 集群全局可观测性:分析分片吞吐量、连接利用率和分布式负载均衡情况。
设置和配置
- 登录您的 Site24x7 账户,导航至云 > 阿里云 > 添加监视器。
- 在编辑阿里云监视器页面,从服务类型列表中选择 ApsaraDB for MongoDB。
- 添加完成后,前往云 > 阿里云 > ApsaraDB for MongoDB,查看仪表板和性能指标。
支持的指标
内存与缓存指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 内存利用率 | 实例的内存使用百分比。 | 百分比 |
| WiredTiger 缓存使用率 | WiredTiger 缓存的使用百分比。 | 百分比 |
| WiredTiger 缓存脏数据使用率 | WiredTiger 缓存中脏数据占用的百分比。 | 百分比 |
| 从缓存读取的字节数 | 每个节点从缓存读取的字节数。 | 字节 |
| 写入缓存的字节数 | 写入缓存的字节数。 | 字节 |
| 缓存字节数 | 缓存中使用的总字节数。 | 字节 |
存储与 IOPS 指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 数据 IOPS 利用率 | 已消耗 IOPS 的百分比。 | 百分比 |
| 数据 IOPS | 数据执行的 I/O 操作次数。 | 次 |
| I/O 带宽 | 每个节点的 I/O 带宽使用量。 | 字节/秒 |
| 实例磁盘容量 | 分配给实例的总磁盘容量。 | 字节 |
| 磁盘利用率 | 磁盘使用率百分比。 | 百分比 |
查询与命令性能指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 每秒查询数 (QPS) | 每秒处理的查询数量。 | 次/秒 |
| 命令平均响应时间 | 每个节点的命令平均响应时间。 | 毫秒 |
| 查询操作数 | 执行的查询操作次数。 | 次 |
| 更新操作数 | 执行的更新操作次数。 | 次 |
| 删除操作数 | 执行的删除操作次数。 | 次 |
| 插入操作数 | 执行的插入操作次数。 | 次 |
| 命令操作数 | 执行的命令操作次数。 | 次 |
| 扫描文档数 | 扫描的文档数量。 | 次 |
| 每秒返回文档数 | 每秒返回的文档数量。 | 次/秒 |
| 每秒每节点插入文档数 | 每个节点每秒插入的文档数量。 | 次/秒 |
| 每秒更新文档数 | 每个节点每秒更新的文档数量。 | 次/秒 |
事务指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 每秒启动事务数 | 每个节点每秒启动的事务数量。 | 次/秒 |
| 每秒每节点提交事务总数 | 每个节点每秒提交的事务数量。 | 次/秒 |
| 每秒中止事务数 | 每个节点每秒中止的事务数量。 | 次/秒 |
| 每秒准备事务数 | 每个节点每秒处于准备状态的事务数量。 | 次/秒 |
| 每秒每节点准备后提交事务数 | 准备后最终提交的事务数量。 | 次 |
| 每秒准备后中止事务数 | 准备后最终中止的事务数量。 | 次 |
复制指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 副本更新数 | 复制的更新操作次数。 | 次 |
| 副本插入数 | 复制的插入操作次数。 | 次 |
| 副本删除数 | 复制的删除操作次数。 | 次 |
| 副本 GetMore 数 | 复制的 getMore 操作次数。 | 次 |
| 副本查询数 | 复制的查询操作次数。 | 次 |
| 复制延迟 | 主节点与从节点之间的复制延迟。 | 毫秒 |
连接与会话指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 连接数 | 当前打开的连接总数。 | 个 |
| 可用连接数 | 可用连接的数量。 | 个 |
| 活跃连接数 | 活跃连接的数量。 | 个 |
| 每节点已关闭游标数 | 每个节点已关闭的游标数量。 | 个 |
| 每秒创建连接数 | 每秒新建的连接数量。 | 个/秒 |
分片与集群负载指标
| 指标名称 | 说明 | 单位 |
|---|---|---|
| 分片每秒查询数 (QPS) | 分片集群中每秒执行的查询数量。 | 次/秒 |
| 分片每秒插入文档数 | 分片集群中每个节点每秒插入的文档数量。 | 次/秒 |
| 分片每秒更新文档数 | 分片集群中每个节点每秒更新的文档数量。 | 次/秒 |
| 分片节点读取带宽 | 分片集群中每个节点的读取带宽。 | 字节/秒 |
| 分片连接利用率 | 分片连接利用率百分比。 | 百分比 |
| 分片副本更新数 | 分片集群中每个节点的复制更新次数。 | 次 |
| 分片逻辑 IOPS | 分片集群中每个节点的日志 IOPS 数量。 | 次 |
阈值配置
- 前往管理 > 配置文件 > 阈值和可用性。
- 为 ApsaraDB for MongoDB 创建或编辑阈值配置文件。
- 将配置文件分配给相应的监视器以触发告警。
IT 自动化
Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。发生阈值违规时,告警引擎会持续检查已定义阈值的系统事件,并执行映射的自动化操作。
- 前往管理 > IT 自动化模板。
- 创建新的自动化规则。
- 将规则映射至监视器,以实现主动处理。
配置规则
使用 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数,并自动化配置监控资源的设置。新增 ApsaraDB for MongoDB 监视器时,可自动应用这些设置。
