Amazon DocumentDB 监控集成
Amazon DocumentDB 是一种文档数据库服务,兼容 MongoDB 工作负载,可大规模管理 JSON 数据。借助 Site24x7 的集成,您可以监控 Amazon DocumentDB 集群和实例的健康状况与性能。
设置
- 请通过创建 IAM 用户或 IAM 角色,为 Site24x7 提供对您 AWS 账户的访问权限。了解更多。
- 在集成 AWS 账户页面,请确认待发现服务字段中已勾选 DocumentDB 复选框。了解更多。
权限
请确保为 Site24x7 创建的 IAM 用户或 IAM 角色所分配的 IAM 策略中包含以下读取级别操作。了解更多。
- "rds:DescribeDBClusters",
- "rds:DescribeDBInstances",
- "rds:ListTagsForResource",
- "rds:DescribeCertificates",
- "rds:DescribeEvents",
- "rds:DescribeGlobalClusters",
- "logs:DescribeLogStreams",
- "logs:GetLogEvents",
- "logs:GetLogEvents",
轮询频率
DocumentDB 聚合指标数据按设定的轮询频率(1 分钟到一天)进行收集。了解更多。
许可证
- 每个 DocumentDB 监视器均视为一个基础监视器。
支持的指标
DocumentDB 集群和实例指标
| 属性 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| 备份保留期存储使用量 | 用于支持 Amazon DocumentDB 保留窗口内时间点恢复功能的备份存储总量(GiB)。 | 最大值 | GB、字节 |
| 变更流日志大小 | 集群用于存储变更流日志的存储量(MB)。 | 平均值 | MB |
| CPU 使用率 | 集群使用的 CPU 百分比 | 最大值 | 百分比 |
| 数据库连接数 | 以一分钟频率采集的集群上打开的连接数。 | 平均值、总计、最大值 | Count |
| 数据库连接最大值 | 一分钟内集群上打开的数据库连接最大数量。 | 平均值、总计、最大值 | Count |
| 数据库游标数 | 以一分钟频率采集的集群上打开的游标数。 | 平均值、总计、最大值 | Count |
| 数据库游标最大值 | 一分钟内集群上打开的游标最大数量。 | 平均值、总计、最大值 | Count |
| 数据库游标超时数 | 一分钟内超时的游标数量。 | 总计 | Count |
| 可用内存 | 可用随机存取内存的量。 | 平均值 | 字节 |
| 可用本地存储 | 此指标报告每个实例可用于临时表和日志的存储量。 | 平均值 | MB |
| 低内存限流队列深度 | 由于可用内存不足而被限流的请求队列深度 | 总计 | Count |
| 低内存限流最大队列深度 | 由于可用内存不足而被限流的请求最大队列深度 | 总计 | Count |
| 低内存限流操作数量 | 由于可用内存不足而被限流的请求数量 | 总计 | Count |
| 快照存储使用量 | 备份保留窗口外给定 Amazon DocumentDB 集群所有快照消耗的备份存储总量(GiB) | 平均值 | GB、字节 |
| 计费备份存储总量 | 给定 Amazon DocumentDB 集群计费的备份存储总量(GiB) | 最大值 | GB、字节 |
| 打开的事务数 | 实例上打开的事务数量 | 平均值、总计、最大值 | Count |
| 事务最大打开数 | 实例上打开的事务最大数量 | 平均值、总计、最大值 | Count |
| 卷使用字节数 | 集群使用的存储量(字节) | 平均值 | MB |
| DB 集群副本延迟最大值 | 主实例与集群中每个 Amazon DocumentDB 实例之间的最大延迟(毫秒) | 最大值 | ms |
| DB 集群副本延迟最小值 | 主实例与集群中每个副本实例之间的最小延迟(毫秒)。 | 最小值 | ms |
| DB 实例副本延迟 | 将更新从主实例复制到副本实例时的延迟量(毫秒)。 | 平均值 | ms |
| 读取延迟 | 每次磁盘 I/O 操作的平均时间。 | 平均值 | ms |
| 写入延迟 | 每次磁盘 I/O 操作的平均时间(毫秒)。 | 平均值 | ms |
| 低内存操作超时数量 | 由于可用内存不足而超时的操作数量 | 总计 | Count |
| 已删除文档数 | 已删除的文档数量 | 总计 | Count |
| 已插入文档数 | 已插入的文档数量 | 总计 | Count |
| 已返回文档数 | 已返回的文档数量 | 总计 | Count |
| 已更新文档数 | 已更新的文档数量 | 总计 | Count |
| 操作计数器 - 命令 | 命令数量 | 总计 | Count |
| 操作计数器 - 删除 | 删除操作数量 | 总计 | Count |
| 操作计数器 - Getmore | getmore 数量 | 总计 | Count |
| 操作计数器 - 插入 | 插入操作数量 | 总计 | Count |
| 操作计数器 - 查询 | 发出的查询数量 | 总计 | Count |
| 操作计数器 - 更新 | 发出的更新操作数量 | 总计 | Count |
| 已启动事务数 | 已启动的事务数量 | 总计 | Count |
| 已提交事务数 | 已提交的事务数量 | 总计 | Count |
| 已中止事务数 | 已中止的事务数量 | 总计 | Count |
| TTL 已删除文档数 | 已删除的文档数量 | 总计 | Count |
| 网络接收吞吐量 | 集群中每个实例从客户端接收的网络吞吐量(字节/秒) | 平均值 | mb/sec |
| 网络吞吐量 | Amazon DocumentDB 集群中每个实例从客户端接收和发送给客户端的网络吞吐量(字节/秒)。 | 平均值 | mb/sec |
| 网络发送吞吐量 | 集群中每个实例发送给客户端的网络吞吐量(字节/秒)。 | 平均值 | mb/sec |
| 读取 IOPS | 每秒磁盘读取 I/O 操作的平均次数。 | 平均值 | Count |
| 写入 IOPS | 每秒磁盘写入 I/O 操作的平均次数。 | 平均值 | Count |
| 读取吞吐量 | 每秒从磁盘读取的平均字节数。 | 平均值 | 字节/秒 |
| 写入吞吐量 | 每秒写入磁盘的平均字节数。 | 平均值 | 字节/秒 |
| 卷读取 IOPs | 集群卷的平均计费读取 I/O 操作次数 | 平均值 | Count |
| 卷写入 IOPs | 集群卷的平均计费写入 I/O 操作次数 | 平均值 | Count |
| 缓冲区缓存命中率 | 由缓冲区缓存处理的请求百分比。 | 平均值 | 百分比 |
| 磁盘队列深度 | 分布式存储卷的并发写入请求数量。 | 总计 | Count |
| 引擎正常运行时间 | 实例已运行的时间(秒)。 | 平均值 | 秒 |
| 索引缓冲区缓存命中率 | 由缓冲区缓存处理的索引请求百分比。 | 平均值 | 百分比 |
| CPU 积分使用量 | 测量期间消耗的 CPU 积分数量。 | 平均值 | Count |
| CPU 积分余额 | 实例已累积的 CPU 积分数量。 | 平均值 | Count |
| CPU 超额积分余额 | 当 CPUCreditBalance 值为零时,为维持 CPU 性能而消耗的超额 CPU 积分数量。 | 平均值 | Count |
| CPU 超额积分收费 | 超过 24 小时内可获得的最大 CPU 积分数量的超额 CPU 积分数量,因此会产生额外费用。 | 平均值 | Count |
| 交换空间使用量 | 实例上使用的交换空间量。 | 平均值 | 字节 |
| 内存使用率 | DocumentDB 集群或实例使用的总内存百分比。 | 平均值 | 百分比 |
| 可用内存百分比 | 可用随机存取内存的百分比。 | 平均值 | 百分比 |
| 可用本地存储百分比 | 每个实例可用于临时表和日志的存储百分比。 | 平均值 | 百分比 |
DocumentDB 全球集群指标
| 属性 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| 全球集群已复制写入 IO | 从主 AWS 区域中的集群卷复制到辅助 AWS 区域中的集群卷的平均计费写入 I/O 操作次数 | 平均值 | Count |
| 全球集群数据传输字节数 | 从主集群 AWS 区域传输到辅助集群 AWS 区域的数据量 | 平均值 | MB |
| 全球集群复制延迟 | 将变更事件从主集群 AWS 区域复制到辅助集群 AWS 区域时的延迟量(毫秒) | 平均值 | ms |
查看数据
- 登录 Site24x7 控制台,点击 AWS,选择已监控的 AWS 账户。
- 从菜单下拉列表中选择 DocumentDB 。
- 从已监控资源列表中,选择您要查看指标的 DocumentDB 资源。
阈值配置
为 DocumentDB 的各项性能指标设置阈值,并在超过配置值时接收告警。
- 前往 Admin > Configuration Profiles > Threshold and Availability > (+)。您也可以通过 Cloud > AWS > 点击 AWS 账户 > DocumentDB Cluster/DocumentDB Instance/DocumentDB Global Clusters > 悬停在显示名称旁的汉堡图标上 > Edit > Threshold and Availability > 点击铅笔图标进行导航。
- 在添加阈值和可用性 表单中,选择 DocumentDB Cluster、DocumentDB Global Clusters 或 DocumentDB Instance。
- 为所需指标设置阈值。
- 保存更改。
Site24x7 的 DocumentDB 监控界面
摘要
此部分提供 CPU 使用率、数据库连接数、数据库连接最大值、数据库游标数、数据库游标最大值、可用内存、缓冲区缓存命中率、低内存操作超时数量、快照和备份存储等众多指标的运营详情。
配置详情
获取集群 ID、状态、可用区、区域、备份保留期、引擎名称及版本、主用户名、端口、子网组详情和其他配置详情。
已监控资源
此处提供各种资源可用性状态,包含关联的 DocumentDB 集群和实例、资源名称、类型、显示名称、状态和操作信息。操作列允许您为被标记为宕机、严重或故障的被监控资源设置告警和添加自动化。
审计日志和分析器日志
查看审计事件和分析器事件,以监控在集群上执行操作的执行时间和详细信息。这些日志有助于识别集群上的慢速操作,并改善单个查询性能和整体集群性能。
集群事件
查看与集群、实例、快照、安全组和集群参数组相关的事件。获取包括事件日期和时间、事件源名称和源类型以及与事件相关的消息等详情。此选项卡仅适用于 DocumentDB Cluster 和 DocumentDB Instance 监视器。
中断
中断选项卡显示资源各种状态(如宕机、故障、严重或维护)的历史记录。此部分提供中断的开始时间和结束时间、持续时间以及备注(如有)详情。您也可以编辑或删除备注。
日志报表
在此处,您可以查看 DocumentDB 集群和实例的审计日志数据,以及时间戳、状态、CPU 使用率、数据库连接总数和数据库游标总数等详情。
