Amazon Redshift 监控集成
Amazon Redshift 是 AWS 云中的全托管数据仓库,支持使用 SQL 对大型数据集运行复杂查询。通过 Site24x7 集成,用户可以监控和告警集群的健康状态和性能。
设置与配置
- 如果尚未完成,请通过将 Site24x7 创建为 IAM 用户或在您的 AWS 账户与 Site24x7 的 AWS 账户之间创建跨账户 IAM 角色,来启用 Site24x7 对您的 AWS 资源的程序化访问。了解更多
- 在集成 AWS 账户页面,确保在待发现服务字段下勾选了 Redshift。了解更多。
策略和权限
要允许 Site24x7 访问 Redshift 集群并收集指标数据,请为 Site24x7 实体分配 AWS 托管策略 ReadOnlyAccess,或确保分配给 Site24x7 实体(IAM 用户或 IAM 角色)的自定义 IAM 策略中存在以下读级别操作。了解更多。
- "redshift:DescribeClusters",
- "redshift:DescribeClusterParameters",
- "redshift:DescribeLoggingStatus",
- "redshift:DescribeEvents",
- "redshift:DescribeStorage"
轮询间隔
Site24x7 按照设定的轮询频率(1 分钟到一天)收集指标数据。了解更多。
受监控资源
查看与您的 Redshift 监视器关联的受监控资源列表。单击某条记录可查看与该资源关联的性能和资源使用统计。您还可以通过单击操作下的铅笔图标设置阈值,并在任何服务失败时收到通知。
IT 自动化
您可以为 Site24x7 支持的 AWS 服务添加自动化。登录 Site24x7,前往管理 > IT 自动化模板 (+) > 添加自动化模板。添加自动化后,您可以安排它们依次执行。
您现在可以使用 Amazon Redshift 自动化重启 Redshift 集群。
许可证
- 每个 Redshift 集群被视为一个基本监视器。
- 集群中预置的每个计算节点被视为一个基本监视器。
支持的指标
集群
以下指标在集群级别收集:
| 属性 | 描述 | 统计方式 | 数据类型 |
|---|---|---|---|
| CPU 利用率 | 衡量集群所有节点的综合 CPU 使用情况。 | 平均值 | 百分比 |
| 数据库连接数 | 衡量集群的数据库连接数量。 | 总计 | 数量 |
| 维护模式 | 指示集群是否处于维护模式。可能的值为 0 和 1。 | - | 布尔值 |
节点
以下指标按每个节点收集:
| 属性 | 描述 | 统计方式 | 数据类型 |
|---|---|---|---|
| 读取 IOPS | 衡量每秒磁盘读取操作次数。 | 平均值 | 次数/秒 |
| 读取延迟 | 衡量磁盘读取 I/O 操作所用的时间。 | 平均值 | 秒 |
| 读取吞吐量 | 衡量每秒从磁盘读取的平均字节数。 | 平均值 | MB/s |
| 写入 IOPS | 衡量每秒磁盘写入操作的平均次数。 | 平均值 | 次数/秒 |
| 写入延迟 | 衡量磁盘写入 I/O 操作所用的时间。 | 平均值 | 秒 |
| 写入吞吐量 | 衡量每秒写入磁盘的字节数。 | 平均值 | MB/s |
集群和节点
以下指标同时在集群和节点级别收集:
| 属性 | 描述 | 统计方式 | 数据类型 |
|---|---|---|---|
| 网络接收吞吐量 | 衡量节点或集群接收数据的速率。 | 平均值 | MB/s |
| 网络发送吞吐量 | 衡量节点或集群写入数据的速率。 | 平均值 | MB/s |
| 磁盘空间使用百分比 | 衡量已使用磁盘空间的百分比。 | 平均值 | 百分比 |
数据库
以下指标在数据库级别收集:
| 属性 | 描述 | 统计方式 | 数据类型 |
|---|---|---|---|
| 每秒完成查询数 | 衡量每秒完成的查询数量(以 5 分钟聚合值报告)。 | 平均值 | 次数/秒 |
| 查询时长 | 衡量完成一次查询所用的时间。 | 平均值 | 秒 |
| 查询运行时间分解 | 衡量活跃查询在各执行阶段所花费的时间。 | 平均值 | 秒 |
查看数据
- 登录 Site24x7 控制台。从左侧导航面板中选择 AWS,选择受监控的 AWS 账户。
- 从下拉菜单中选择 Redshift Cluster(或)Redshift Node。
- 从受监控集群或节点列表中,选择要查看指标的 Redshift 组件。
元数据
以下是关于集群状态和配置的收集信息:
| 属性 | 描述 |
|---|---|
| 集群名称 | 集群的唯一标识符。 |
| 节点数量 | 集群节点数的待处理或进行中的变更。 |
| 可用区 | 集群所在可用区的名称。 |
| 创建时间 | 集群的创建日期和时间。 |
| 集群版本 | 服务版本的待处理或进行中的变更。 |
| VPC ID | 集群所在 VPC 的标识符。 |
| 集群子网组 | 与集群关联的子网组名称。 |
| 集群参数组 | 与集群关联的集群参数组列表。 |
| 参数组应用状态 | 表示参数是否同步的参数状态。 |
| 增强型 VPC 路由 | 指定是否启用增强型 VPC 路由的选项。可能的值:true 或 false。 |
| IAM 角色 | 集群可用于访问其他 AWS 服务的 AWS IAM 角色列表。 |
| VPC 安全组 | 与集群关联的 Amazon VPC 安全组列表。 |
| 数据库名称 | 创建集群时所创建的初始数据库名称。 |
| 端点地址 | 与集群关联的 Amazon VPC 安全组列表。 |
| 端点端口 | 集群的 DNS 地址。 |
| 加密 | 集群的加密类型。可能的值为 KMS 和 none。 |
| 可公开访问 | 指示集群是否可以从公共网络访问。可能的值:true 或 false。 |
| 节点类型 | 集群中节点的节点类型。 |
| CPU | 每个节点的虚拟 CPU 数量。 |
| 内存 | 每个节点的内存量(以 GiB 为单位)。 |
| 存储 | 每个节点的存储容量和类型。 |
| 数据保留期 | 自动集群快照的保留天数。 |
| 首选维护窗口 | 可以进行系统维护的每周时间范围。 |
| 允许版本升级 | 指示主版本升级是否将自动应用于集群。可能的值:true 或 false。 |
