Amazon Neptune 集群监控集成
Amazon Neptune 是一项完全托管的图数据库服务,用于构建和运行需要处理高度关联数据集的应用程序。一个 Amazon Neptune 集群包含一个或多个 Neptune 实例。
设置和配置
1. 如果您尚未完成此操作,请通过以下方式在 AWS 账户与 Site24x7 AWS 账户之间启用对 AWS 资源的访问权限:
- 将 Site24x7 创建为 IAM 用户
- 创建跨账户 IAM 角色。了解更多
2. 在"集成 AWS 账户"页面上,勾选 Amazon Neptune 集群旁边的复选框。了解更多
策略和权限
Site24x7 发现 Amazon Neptune 并收集配置信息需要以下权限。了解更多
- "rds:DescribeDBInstances",
- "rds:ListTagsForResource",
- "rds:DescribeDBClusters",
- "rds:DescribeEvents",
- "logs:DescribeLogStreams",
- "logs:GetLogEvents",
- "rds:DescribeDBClusterParameterGroups"
轮询频率
Site24x7 根据配置的轮询频率向 AWS 查询以收集 Neptune 集群性能指标。支持的最小轮询间隔为一分钟,最大为 24 小时。了解更多
支持的指标
| 属性 | 描述 | 统计类型 | 数据类型 |
|---|---|---|---|
| Cluster ReplicaLag Maximum | 主实例与 DB 集群中每个 Neptune DB 实例之间的最大延迟量 | 最大值 | 毫秒 |
| Cluster ReplicaLag Minimum | 主实例与 DB 集群中每个 Neptune DB 实例之间的最小延迟量 | 最小值 | 毫秒 |
| Engine Up Time | 实例已运行的时间 | 最大值 | 秒 |
| Freeable Memory | 可用的随机存取内存量 | 最小值 | MB |
| Free Local Storage | 可用于临时表和日志的存储空间 | 最小值 | MB |
| Gremlin Errors | Gremlin 遍历中的错误数 | 总计 | 个 |
| Gremlin Requests | 向 Gremlin 引擎发出的请求数 | 总计 | 个 |
| Gremlin Requests Per Sec | 每秒向 Gremlin 引擎发出的请求数 | 总计 | 个/秒 |
| Gremlin WebSocket Available Connections | 当前可用的 WebSocket 连接数 | 总计 | 个/秒 |
| Gremlin WebSocket Client Errors | 每秒 Gremlin 端点上的 WebSocket 客户端错误数 | 总计 | 个/秒 |
| Gremlin WebSocket Server Errors | 每秒 Gremlin 端点上的 WebSocket 服务器错误数 | 总计 | 个/秒 |
| Gremlin WebSocket Success | 每秒成功建立到 Gremlin 端点的 WebSocket 连接数 | 总计 | 个/秒 |
| Loader Errors | 来自 Loader 请求的错误数 | 总计 | 个 |
| Loader Requests | Loader 请求数 | 总计 | 个 |
| Network Receive Throughput | DB 实例上的入站网络流量,包括客户数据库流量和用于监控与复制的 Neptune 流量 | 平均值 | MB/秒 |
| Network Throughput | Neptune DB 集群中每个实例从客户端接收和向客户端发送的网络吞吐量 | 平均值 | MB/秒 |
| Network Transmit Throughput | DB 实例上的出站网络流量,包括客户数据库流量和用于监控与复制的 Neptune 流量 | 平均值 | MB/秒 |
| SPARQL Errors | SPARQL 查询中的错误数 | 总计 | 个 |
| SPARQL Requests | 向 SPARQL 引擎发出的请求数 | 总计 | 个 |
| SPARQL Requests Per Sec | 每秒向 SPARQL 引擎发出的请求数 | 总计 | 个/秒 |
| Status Errors | 来自状态端点的错误数 | 总计 | 个 |
| Status Requests | 向状态端点发出的请求数 | 总计 | 个 |
| Http1xx | 每秒端点的 HTTP 1xx 错误数 | 总计 | 个/秒 |
| Http2xx | 每秒端点的 HTTP 2xx 错误数 | 总计 | 个/秒 |
| Http4xx | 每秒端点的 HTTP 4xx 错误数 | 总计 | 个/秒 |
| Http5xx | 每秒端点的 HTTP 5xx 错误数 | 总计 | 个/秒 |
| Gremlin Http1xx | 每秒 Gremlin 端点的 HTTP 1xx 错误数 | 总计 | 个/秒 |
| Gremlin Http2xx | 每秒 Gremlin 端点的 HTTP 2xx 错误数 | 总计 | 个/秒 |
| Gremlin Http4xx | 每秒 Gremlin 端点的 HTTP 4xx 错误数 | 总计 | 个/秒 |
| Gremlin Http5xx | 每秒 Gremlin 端点的 HTTP 5xx 错误数 | 总计 | 个/秒 |
| Sparql Http1xx | 每秒 SPARQL 端点的 HTTP 1xx 错误数 | 总计 | 个/秒 |
| Sparql Http2xx | 每秒 SPARQL 端点的 HTTP 2xx 错误数 | 总计 | 个/秒 |
| Sparql Http4xx | 每秒 SPARQL 端点的 HTTP 4xx 错误数 | 总计 | 个/秒 |
| Sparql Http5xx | 每秒 SPARQL 端点的 HTTP 5xx 错误数 | 总计 | 个/秒 |
| Backup Retention Period Storage Used | 在备份保留窗口内用于支持时间点恢复功能的已计费备份存储量 | 最大值 | MB |
| Cluster Replica Lag | 对于只读副本,从主实例复制更新时的延迟量 | 平均值 | 毫秒 |
| Total Backup Storage Billed | 已计费备份存储的总量 | 最大值 | MB |
| Volume ReadI OPs | 来自集群卷的平均已计费读取 I/O 操作数 | 总计 | 个 |
| Volume WriteI OPs | 写入集群卷的平均磁盘 I/O 操作数 | 总计 | 个 |
| Volume Bytes Used | Neptune DB 实例使用的存储量 | 总计 | MB |
预测
估算以下性能指标的未来值,并就增加容量或扩展 AWS 基础设施做出明智决策。
- CPU 利用率
- Gremlin Errors
- Gremlin Requests
- SPARQL Errors
- SPARQL Requests
- Volume Bytes Used
许可
- 每个 Amazon Neptune 集群监视器计为一个基本监视器。
Site24x7 Amazon Neptune 集群监控选项卡
概要
通过提供 Gremlin 请求、Gremlin 错误、网络吞吐量、SPARQL 错误和 SPARQL 请求事件时间线的时间序列图表,全面了解每个集群内各流程的情况。
Neptune 实例
如果您正在使用 Site24x7 监控 Neptune 实例,这些服务的状态将在 Neptune 实例选项卡中列出。您可以点击任意服务查看其详细指标。您还可以通过点击操作列下的铅笔图标设置阈值,并在任意服务发生故障时收到通知。
配置详情
此选项卡提供集群的配置详情,包括集群状态、集群 ARN、端点 URL、引擎版本、已分配存储空间等信息。
事件
"事件"选项卡包含与 DB 实例、DB 安全组、DB 快照和 DB 参数组相关的历史事件信息。
最近日志
在这里,您可以查看已由 CloudWatch Logs 发布的 Neptune DB 集群审计日志数据。
