帮助手册

Amazon DocumentDB 监控集成

Amazon DocumentDB 是一种文档数据库服务,兼容 MongoDB 工作负载,可大规模管理 JSON 数据。借助 Site24x7 的集成,您可以监控 Amazon DocumentDB 集群和实例的健康状况与性能。

设置

  • 请通过创建 IAM 用户或 IAM 角色,为 Site24x7 提供对您 AWS 账户的访问权限。了解更多
  • 集成 AWS 账户页面,请确认待发现服务字段中已勾选 DocumentDB 复选框。了解更多

权限

请确保为 Site24x7 创建的 IAM 用户或 IAM 角色所分配的 IAM 策略中包含以下读取级别操作。了解更多

  • "rds:DescribeDBClusters",
  • "rds:DescribeDBInstances",
  • "rds:ListTagsForResource",
  • "rds:DescribeCertificates",
  • "rds:DescribeEvents",
  • "rds:DescribeGlobalClusters",
  • "logs:DescribeLogStreams",
  • "logs:GetLogEvents",
  • "logs:GetLogEvents",

轮询频率

DocumentDB 聚合指标数据按设定的轮询频率(1 分钟到一天)进行收集。了解更多

许可证

支持的指标

DocumentDB 集群和实例指标

属性 描述 统计方式 单位
备份保留期存储使用量 用于支持 Amazon DocumentDB 保留窗口内时间点恢复功能的备份存储总量(GiB)。  最大值 GB、字节
变更流日志大小 集群用于存储变更流日志的存储量(MB)。 平均值 MB
CPU 使用率 集群使用的 CPU 百分比 最大值 百分比
数据库连接数 以一分钟频率采集的集群上打开的连接数。 平均值、总计、最大值 Count
数据库连接最大值 一分钟内集群上打开的数据库连接最大数量。 平均值、总计、最大值 Count
数据库游标数 以一分钟频率采集的集群上打开的游标数。 平均值、总计、最大值 Count
数据库游标最大值 一分钟内集群上打开的游标最大数量。 平均值、总计、最大值 Count
数据库游标超时数 一分钟内超时的游标数量。 总计 Count
可用内存 可用随机存取内存的量。 平均值 字节
可用本地存储 此指标报告每个实例可用于临时表和日志的存储量。 平均值 MB
低内存限流队列深度 由于可用内存不足而被限流的请求队列深度  总计 Count
低内存限流最大队列深度 由于可用内存不足而被限流的请求最大队列深度 总计 Count
低内存限流操作数量 由于可用内存不足而被限流的请求数量 总计 Count
快照存储使用量 备份保留窗口外给定 Amazon DocumentDB 集群所有快照消耗的备份存储总量(GiB) 平均值 GB、字节
计费备份存储总量 给定 Amazon DocumentDB 集群计费的备份存储总量(GiB) 最大值 GB、字节
打开的事务数 实例上打开的事务数量 平均值、总计、最大值 Count
事务最大打开数 实例上打开的事务最大数量 平均值、总计、最大值 Count
卷使用字节数 集群使用的存储量(字节) 平均值 MB
DB 集群副本延迟最大值 主实例与集群中每个 Amazon DocumentDB 实例之间的最大延迟(毫秒) 最大值 ms
DB 集群副本延迟最小值 主实例与集群中每个副本实例之间的最小延迟(毫秒)。 最小值 ms
DB 实例副本延迟 将更新从主实例复制到副本实例时的延迟量(毫秒)。 平均值 ms
读取延迟 每次磁盘 I/O 操作的平均时间。 平均值 ms
写入延迟 每次磁盘 I/O 操作的平均时间(毫秒)。 平均值 ms
低内存操作超时数量 由于可用内存不足而超时的操作数量 总计 Count
已删除文档数 已删除的文档数量 总计 Count
已插入文档数 已插入的文档数量 总计 Count
已返回文档数 已返回的文档数量 总计 Count
已更新文档数 已更新的文档数量 总计 Count
操作计数器 - 命令 命令数量 总计 Count
操作计数器 - 删除 删除操作数量 总计 Count
操作计数器 - Getmore getmore 数量 总计 Count
操作计数器 - 插入 插入操作数量 总计 Count
操作计数器 - 查询 发出的查询数量 总计 Count
操作计数器 - 更新 发出的更新操作数量 总计 Count
已启动事务数 已启动的事务数量 总计 Count
已提交事务数 已提交的事务数量 总计 Count
已中止事务数 已中止的事务数量 总计 Count
TTL 已删除文档数 已删除的文档数量 总计 Count
网络接收吞吐量 集群中每个实例从客户端接收的网络吞吐量(字节/秒) 平均值 mb/sec
网络吞吐量 Amazon DocumentDB 集群中每个实例从客户端接收和发送给客户端的网络吞吐量(字节/秒)。 平均值 mb/sec
网络发送吞吐量 集群中每个实例发送给客户端的网络吞吐量(字节/秒)。  平均值  mb/sec 
读取 IOPS  每秒磁盘读取 I/O 操作的平均次数。   平均值  Count 
写入 IOPS  每秒磁盘写入 I/O 操作的平均次数。  平均值  Count 
读取吞吐量  每秒从磁盘读取的平均字节数。  平均值  字节/秒 
写入吞吐量  每秒写入磁盘的平均字节数。  平均值  字节/秒 
卷读取 IOPs  集群卷的平均计费读取 I/O 操作次数  平均值  Count 
卷写入 IOPs  集群卷的平均计费写入 I/O 操作次数  平均值  Count 
缓冲区缓存命中率  由缓冲区缓存处理的请求百分比。  平均值   百分比 
磁盘队列深度  分布式存储卷的并发写入请求数量。  总计  Count 
引擎正常运行时间  实例已运行的时间(秒)。  平均值   秒 
索引缓冲区缓存命中率 由缓冲区缓存处理的索引请求百分比。  平均值    百分比 
CPU 积分使用量 测量期间消耗的 CPU 积分数量。  平均值    Count 
CPU 积分余额 实例已累积的 CPU 积分数量。  平均值    Count  
CPU 超额积分余额 当 CPUCreditBalance 值为零时,为维持 CPU 性能而消耗的超额 CPU 积分数量。  平均值    Count  
CPU 超额积分收费 超过 24 小时内可获得的最大 CPU 积分数量的超额 CPU 积分数量,因此会产生额外费用。  平均值    Count  
交换空间使用量 实例上使用的交换空间量。  平均值    字节 
内存使用率 DocumentDB 集群或实例使用的总内存百分比。 平均值 百分比
可用内存百分比 可用随机存取内存的百分比。 平均值 百分比
可用本地存储百分比 每个实例可用于临时表和日志的存储百分比。 平均值 百分比

DocumentDB 全球集群指标

属性 描述 统计方式 单位
全球集群已复制写入 IO 从主 AWS 区域中的集群卷复制到辅助 AWS 区域中的集群卷的平均计费写入 I/O 操作次数 平均值 Count
全球集群数据传输字节数 从主集群 AWS 区域传输到辅助集群 AWS 区域的数据量 平均值 MB
全球集群复制延迟 将变更事件从主集群 AWS 区域复制到辅助集群 AWS 区域时的延迟量(毫秒) 平均值 ms

查看数据

  • 登录 Site24x7 控制台,点击 AWS,选择已监控的 AWS 账户。
  • 从菜单下拉列表中选择 DocumentDB 
  • 从已监控资源列表中,选择您要查看指标的 DocumentDB 资源。

阈值配置

为 DocumentDB 的各项性能指标设置阈值,并在超过配置值时接收告警。

  1. 前往 Admin > Configuration Profiles > Threshold and Availability > (+)。您也可以通过 Cloud > AWS > 点击 AWS 账户 > DocumentDB Cluster/DocumentDB Instance/DocumentDB Global Clusters > 悬停在显示名称旁的汉堡图标上 > Edit > Threshold and Availability > 点击铅笔图标进行导航。 
  2. 添加阈值和可用性 表单中,选择 DocumentDB ClusterDocumentDB Global ClustersDocumentDB Instance
  3. 为所需指标设置阈值。
  4. 保存更改。

Site24x7 的 DocumentDB 监控界面

摘要

此部分提供 CPU 使用率、数据库连接数、数据库连接最大值、数据库游标数、数据库游标最大值、可用内存、缓冲区缓存命中率、低内存操作超时数量、快照和备份存储等众多指标的运营详情。

配置详情

获取集群 ID、状态、可用区、区域、备份保留期、引擎名称及版本、主用户名、端口、子网组详情和其他配置详情。 

已监控资源

此处提供各种资源可用性状态,包含关联的 DocumentDB 集群和实例、资源名称、类型、显示名称、状态和操作信息。操作列允许您为被标记为宕机、严重或故障的被监控资源设置告警和添加自动化。

审计日志和分析器日志

查看审计事件和分析器事件,以监控在集群上执行操作的执行时间和详细信息。这些日志有助于识别集群上的慢速操作,并改善单个查询性能和整体集群性能。 

集群事件

查看与集群、实例、快照、安全组和集群参数组相关的事件。获取包括事件日期和时间、事件源名称和源类型以及与事件相关的消息等详情。此选项卡仅适用于 DocumentDB Cluster 和 DocumentDB Instance 监视器。

中断

中断选项卡显示资源各种状态(如宕机、故障、严重或维护)的历史记录。此部分提供中断的开始时间和结束时间、持续时间以及备注(如有)详情。您也可以编辑或删除备注。

日志报表

在此处,您可以查看 DocumentDB 集群和实例的审计日志数据,以及时间戳、状态、CPU 使用率、数据库连接总数和数据库游标总数等详情。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!