帮助手册

Amazon Neptune 集群监控集成

Amazon Neptune 是一项完全托管的图数据库服务,用于构建和运行需要处理高度关联数据集的应用程序。一个 Amazon Neptune 集群包含一个或多个 Neptune 实例。

设置和配置

1. 如果您尚未完成此操作,请通过以下方式在 AWS 账户与 Site24x7 AWS 账户之间启用对 AWS 资源的访问权限:

  • 将 Site24x7 创建为 IAM 用户
  • 创建跨账户 IAM 角色。了解更多

2. 在"集成 AWS 账户"页面上,勾选 Amazon Neptune 集群旁边的复选框。了解更多

策略和权限

Site24x7 发现 Amazon Neptune 并收集配置信息需要以下权限。了解更多

  • "rds:DescribeDBInstances",
  • "rds:ListTagsForResource",
  • "rds:DescribeDBClusters",
  • "rds:DescribeEvents",
  • "logs:DescribeLogStreams",
  • "logs:GetLogEvents",
  • "rds:DescribeDBClusterParameterGroups"

轮询频率

Site24x7 根据配置的轮询频率向 AWS 查询以收集 Neptune 集群性能指标。支持的最小轮询间隔为一分钟,最大为 24 小时。了解更多

支持的指标

属性 描述 统计类型 数据类型
Cluster ReplicaLag Maximum 主实例与 DB 集群中每个 Neptune DB 实例之间的最大延迟量 最大值 毫秒
Cluster ReplicaLag Minimum 主实例与 DB 集群中每个 Neptune DB 实例之间的最小延迟量 最小值 毫秒
Engine Up Time 实例已运行的时间 最大值
Freeable Memory 可用的随机存取内存量 最小值 MB
Free Local Storage 可用于临时表和日志的存储空间 最小值 MB
Gremlin Errors Gremlin 遍历中的错误数 总计
Gremlin Requests 向 Gremlin 引擎发出的请求数 总计
Gremlin Requests Per Sec 每秒向 Gremlin 引擎发出的请求数 总计 个/秒
Gremlin WebSocket Available Connections 当前可用的 WebSocket 连接数 总计 个/秒
Gremlin WebSocket Client Errors 每秒 Gremlin 端点上的 WebSocket 客户端错误数 总计 个/秒
Gremlin WebSocket Server Errors 每秒 Gremlin 端点上的 WebSocket 服务器错误数 总计 个/秒
Gremlin WebSocket Success 每秒成功建立到 Gremlin 端点的 WebSocket 连接数 总计 个/秒
Loader Errors 来自 Loader 请求的错误数 总计
Loader Requests Loader 请求数 总计
Network Receive Throughput DB 实例上的入站网络流量,包括客户数据库流量和用于监控与复制的 Neptune 流量 平均值 MB/秒
Network Throughput Neptune DB 集群中每个实例从客户端接收和向客户端发送的网络吞吐量 平均值 MB/秒
Network Transmit Throughput DB 实例上的出站网络流量,包括客户数据库流量和用于监控与复制的 Neptune 流量 平均值 MB/秒
SPARQL Errors SPARQL 查询中的错误数 总计
SPARQL Requests 向 SPARQL 引擎发出的请求数 总计
SPARQL Requests Per Sec 每秒向 SPARQL 引擎发出的请求数 总计 个/秒
Status Errors 来自状态端点的错误数 总计
Status Requests 向状态端点发出的请求数 总计
Http1xx 每秒端点的 HTTP 1xx 错误数 总计 个/秒
Http2xx 每秒端点的 HTTP 2xx 错误数 总计 个/秒
Http4xx 每秒端点的 HTTP 4xx 错误数 总计 个/秒
Http5xx 每秒端点的 HTTP 5xx 错误数 总计 个/秒
Gremlin Http1xx 每秒 Gremlin 端点的 HTTP 1xx 错误数 总计 个/秒
Gremlin Http2xx 每秒 Gremlin 端点的 HTTP 2xx 错误数 总计 个/秒
Gremlin Http4xx 每秒 Gremlin 端点的 HTTP 4xx 错误数 总计 个/秒
Gremlin Http5xx 每秒 Gremlin 端点的 HTTP 5xx 错误数 总计 个/秒
Sparql Http1xx 每秒 SPARQL 端点的 HTTP 1xx 错误数 总计 个/秒
Sparql Http2xx 每秒 SPARQL 端点的 HTTP 2xx 错误数 总计 个/秒
Sparql Http4xx 每秒 SPARQL 端点的 HTTP 4xx 错误数 总计 个/秒
Sparql Http5xx 每秒 SPARQL 端点的 HTTP 5xx 错误数 总计 个/秒
Backup Retention Period Storage Used 在备份保留窗口内用于支持时间点恢复功能的已计费备份存储量 最大值 MB
Cluster Replica Lag 对于只读副本,从主实例复制更新时的延迟量 平均值 毫秒
Total Backup Storage Billed 已计费备份存储的总量 最大值 MB
Volume ReadI OPs 来自集群卷的平均已计费读取 I/O 操作数 总计
Volume WriteI OPs 写入集群卷的平均磁盘 I/O 操作数 总计
Volume Bytes Used Neptune DB 实例使用的存储量 总计 MB

预测

估算以下性能指标的未来值,并就增加容量或扩展 AWS 基础设施做出明智决策。

  • CPU 利用率
  • Gremlin Errors
  • Gremlin Requests
  • SPARQL Errors
  • SPARQL Requests
  • Volume Bytes Used

许可

Site24x7 Amazon Neptune 集群监控选项卡

概要

通过提供 Gremlin 请求、Gremlin 错误、网络吞吐量、SPARQL 错误和 SPARQL 请求事件时间线的时间序列图表,全面了解每个集群内各流程的情况。

Neptune 实例

如果您正在使用 Site24x7 监控 Neptune 实例,这些服务的状态将在 Neptune 实例选项卡中列出。您可以点击任意服务查看其详细指标。您还可以通过点击操作列下的铅笔图标设置阈值,并在任意服务发生故障时收到通知。

配置详情

此选项卡提供集群的配置详情,包括集群状态、集群 ARN、端点 URL、引擎版本、已分配存储空间等信息。

事件

"事件"选项卡包含与 DB 实例、DB 安全组、DB 快照和 DB 参数组相关的历史事件信息。

最近日志

在这里,您可以查看已由 CloudWatch Logs 发布的 Neptune DB 集群审计日志数据。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!