帮助手册

Amazon ElastiCache Valkey 监控

Amazon ElastiCache for Valkey 是 AWS 提供的一项完全托管的内存缓存服务,使用 Valkey——一种开源的、与 Redis 兼容的键值数据存储。它为实时应用程序提供高性能、低延迟和可扩展性,同时减少了手动管理服务器或集群的开销。

通过 Site24x7 与 Amazon ElastiCache for Valkey 的集成,您可以监控无服务器和基于集群的 Valkey 缓存,跟踪性能指标,并在出现问题时收到告警。

概述

此集成涵盖无服务器和基于集群的 Valkey 缓存,包括集群级监控、启用集群模式时的分片(节点组)级监控,以及节点级监控。支持状态传播,因此如果配置了阈值,当任何子监视器(如分片或节点)状态发生变化时,您可以收到通知。您可以监控 CPU 和内存等主机级指标、缓存命中和未命中等 Valkey 特定指标,甚至可以监控命令级指标以跟踪命令使用情况和管理成本。对于启用了日志记录的 Valkey 缓存,还可以针对慢速日志或引擎日志中的错误触发告警。

Site24x7 与 Amazon Elasticache Valkey 的集成提供以下监视器:

  • ElastiCache Valkey Serverless:监控无服务器 Valkey 缓存的健康状况和性能,确保低延迟和经济高效的扩展,无需人工干预。
  • ElastiCache Valkey Cluster:获取整个 Valkey 集群可用性、资源使用情况和性能趋势的综合视图,以便更好地进行容量规划和维持正常运行时间。以下是 ElastiCache Valkey Cluster 的子监视器:
    • ElastiCache Valkey Cluster Shard:跟踪内存使用情况和复制健康等分片级指标,以快速检测影响集群中特定节点组的问题。
    • ElastiCache Valkey Cluster Node:监控单个节点性能,以最细粒度识别故障或瓶颈,实现更快的故障排除。

使用案例

一家电商公司使用 Amazon ElastiCache for Valkey 处理产品目录数据、购物车会话和个性化推荐的实时缓存。在闪购等流量高峰期间,缓存会遭遇请求量的突然激增。借助 Site24x7 的集成,该公司可以监控集群健康状况以确保所有节点正常运行,提前检测复制延迟以防止提供过时数据,并分析命令级指标以识别导致缓存变慢的繁重命令。

主动告警在内存使用量或延迟超过阈值时通知团队,使他们可以在客户受到影响之前采取纠正措施,例如添加节点或清除过期数据。通过将缓存指标与应用程序性能相关联,团队可以快速确定页面加载缓慢是由缓存问题还是应用程序代码引起的,确保即使在流量高峰期间也能提供快速可靠的购物体验。

Site24x7 的 Amazon Elasticache Valkey 集成优势

将您的 Amazon Elasticache Valkey 环境与 Site24x7 集成,充分利用以下优势:

  • 跟踪健康状况和性能:实时监控 Valkey 集群的整体健康状况和性能。
  • 及早发现问题:在内存压力、复制延迟或网络瓶颈影响应用程序性能之前检测到这些问题。
  • 高效利用资源:发现未使用或利用率不足的节点,优化资源分配和成本。
  • 确保可靠性:通过主动告警和历史趋势报表保持高可用性和一致的数据传输。
  • 利用状态传播:当 Elasticache Valkey Cluster Shard 或 Elasticache Valkey Cluster Node 等子监视器发生宕机或性能下降时,自动触发告警。

设置与配置

  1. 登录您的 Site24x7 账户。
  2. 前往 > AWS > 集成 AWS 账户,创建跨账户 IAM 角色,使 Site24x7 能够访问您的 AWS 资源。
  3. 集成 AWS 账户页面,根据您的需求从要发现的服务列表中选择 Elasticache Valkey

权限

确保 Site24x7 获得以下权限以监控 Amazon Elasticache Valkey:

  • "elasticache:DescribeServerlessCaches",
  • "elasticache:DescribeCacheSubnetGroups",
  • "elasticache:ListTagsForResource",
  • "elasticache:DescribeCacheClusters",
  • "elasticache:DescribeReplicationGroups",
  • "elasticache:DescribeServerlessCacheSnapshots",
  • "elasticache:DescribeSnapshots",
  • "elasticache:DescribeEvents",
  • "elasticache:DescribeUpdateActions"

轮询频率

Site24x7 根据设置的轮询频率(从每分钟一次到每天一次)查询 AWS 服务级 API,以从 Amazon Elasticache Valkey 监视器收集指标。

支持的指标

以下是 Amazon Elasticache Valkey 监视器支持的指标。

Elasticache Valkey Serverless

以下是 Elasticache Valkey Serverless 监视器支持的指标。

指标名称 描述 统计 单位
Bytes Used For Cache 缓存中存储数据使用的总字节数。 Average Bytes
ElastiCache Processing Units 在缓存上执行的请求消耗的 ElastiCacheProcessingUnits(ECPU)总数。 Sum Count
Successful Read Request Latency 成功读取请求的延迟。 Average Microseconds
Successful Write Request Latency 成功写入请求的延迟。 Average Microseconds
Total Commands Count 缓存上执行的所有命令的总数。 Sum Count
Cache Hit Rate 表示缓存的命中率。 Average Percentage
Cache Hits 缓存中成功的只读键查找次数。 Sum Count
Current Connections 与缓存的客户端连接数。 Sum Count
Throttled Commands 由于工作负载扩展速度超过 ElastiCache 扩展速度而被 ElastiCache 限流的请求数量。 Sum Count
New Connections 此期间服务器接受的连接总数。 Sum Count
Current Items 缓存中的项目数量。 Sum Count
Current Volatile Items 缓存中设置了 TTL 的项目数量。 Sum Count
Network Bytes In 传入缓存的总字节数。 Average Bytes
Network Bytes Out 从缓存传出的总字节数。 Average Bytes
Evictions 缓存驱逐的键数量。 Sum Count
IAM Authentication Expirations IAM 认证的 Valkey 连接过期总数。 Sum Count
IAM Authentication Throttling IAM 认证的 Valkey AUTH 或 HELLO 请求被限流的总数。 Sum Count
Key Authorization Failures 用户尝试访问无权限键的失败总次数。建议对此设置告警以检测未授权访问尝试。 Sum Count
Authentication Failures 使用 AUTH 命令向 Valkey 进行身份验证失败的总次数。建议对此设置告警以检测未授权访问尝试。 Sum Count
Command Authorization Failures 用户尝试运行无权限命令的失败总次数。建议对此设置告警以检测未授权访问尝试。 Sum Count
Eval Based Commands 缓存收到的 eval 类命令数量。 Sum Count
Eval Based Commands ECPUs eval 类命令消耗的 ECPU 数量。 Sum Count
Geo Spatial Based Commands 地理空间类命令的总数。通过汇总所有 geo 类命令得出:geoaddgeodistgeohashgeoposgeoradiusgeoradiusbymember Sum Count
Geo Spatial Based Commands ECPUs 地理空间类命令消耗的 ECPU 数量。 Sum Count
Get Type Commands 只读类命令的总数。通过汇总 Valkey commandstats 统计中所有只读类命令得出(gethgetscardlrange 等)。 Sum Count
Get Type Commands ECPUs 读取命令消耗的 ECPU 数量。 Sum Count
Hash Based Commands 基于哈希的命令总数。通过汇总 Valkey commandstats 统计中作用于一个或多个哈希的所有命令得出(hgethkeyshvalshdel 等)。 Sum Count
Hash Based Commands ECPUs 哈希类命令消耗的 ECPU 数量。 Sum Count
HyperLog Log Based Commands HyperLogLog 类命令的总数。通过汇总 Valkey commandstats 统计中所有 pf 类命令得出(pfaddpfcountpfmerge 等)。 Sum Count
HyperLog Log Based Commands ECPUs HyperLogLog 类命令消耗的 ECPU 数量。 Sum Count
JSON Based Commands JSON 命令的总数,包括读取和写入命令。通过汇总 Valkey commandstats 统计中作用于 JSON 键的所有 JSON 命令得出。 Sum Count
JSON Based Commands ECPUs 所有 JSON 命令(包括读取和写入命令)消耗的 ECPU 数量。 Sum Count
JSON Based Get Commands JSON 只读命令的总数。通过汇总 Valkey commandstats 统计中作用于 JSON 键的所有 JSON 读取命令得出。 Sum Count
JSON Based Get Commands ECPUs JSON 只读命令消耗的 ECPU 数量。 Sum Count
JSON Based Set Commands JSON 写入命令的总数。通过汇总 Valkey commandstats 统计中作用于 JSON 键的所有 JSON 写入命令得出。 Sum Count
JSON Based Set Commands ECPUs JSON 写入命令消耗的 ECPU 数量。 Sum Count
Key Based Commands 基于键的命令总数。通过汇总 Valkey commandstats 统计中作用于多种数据结构中一个或多个键的所有命令得出(delexpirerename 等)。 Sum Count
Key Based Commands ECPUs 基于键的命令消耗的 ECPU 数量。 Sum Count
List Based Commands 基于列表的命令总数。通过汇总 Valkey commandstats 统计中作用于一个或多个列表的所有命令得出(lindexlrangelpushltrim 等)。 Sum Count
List Based Commands ECPUs 列表类命令消耗的 ECPU 数量。 Sum Count
Non Key Type Commands 非基于键的命令总数。通过汇总 Valkey commandstats 统计中不作用于键的所有命令得出,例如 acldbsizeinfo Sum Count
Non Key Type Commands ECPUs 非基于键的命令消耗的 ECPU 数量。 Sum Count
PubSub Based Commands 发布/订阅功能命令的总数。通过汇总 Valkey commandstats 统计中用于发布/订阅功能的所有命令得出:psubscribepublishpubsubpubsubscribessubscribesunsubscribespublishsubscribeunsubscribe Sum Count
PubSub Based Commands ECPUs 发布/订阅类命令消耗的 ECPU 数量。 Sum Count
Set Based Commands 基于集合的命令总数。通过汇总 Valkey commandstats 统计中作用于一个或多个集合的所有命令得出(scardsdiffsaddsunion 等)。 Sum Count
Set Based Commands ECPUs 集合类命令消耗的 ECPU 数量。 Sum Count
Set Type Commands 写入类命令的总数。通过汇总 Valkey commandstats 统计中作用于数据的所有变更类命令得出(sethsetsaddlpop 等)。 Sum Count
Set Type Commands ECPUs 写入命令消耗的 ECPU 数量。 Sum Count
Sorted Set Based Commands 基于有序集合的命令总数。通过汇总 Valkey commandstats 统计中作用于一个或多个有序集合的所有命令得出(zcountzrangezrankzadd 等)。 Sum Count
Sorted Set Based Commands ECPUs 有序集合类命令消耗的 ECPU 数量。 Sum Count
String Based Commands 基于字符串的命令总数。通过汇总 Valkey commandstats 统计中作用于一个或多个字符串的所有命令得出(strlensetexsetrange 等)。 Sum Count
String Based Commands ECPUs 字符串类命令消耗的 ECPU 数量。 Sum Count
Stream Based Commands 基于流的命令总数。通过汇总 Valkey commandstats 统计中作用于一个或多个流数据类型的所有命令得出(xrangexlenxaddxdel 等)。 Sum Count
Stream Based Commands ECPUs 流类命令消耗的 ECPU 数量。 Sum Count

Elasticache Valkey Cluster

以下是 Elasticache Valkey Cluster 监视器支持的指标。

指标名称 描述 统计 单位
Total Number of Shards 集群缓存中的分片(节点组)总数。 Sum Count
Total Number of Nodes 集群缓存中的节点总数。 Sum Count
Engine CPU Utilization 提供 Valkey 引擎线程的 CPU 利用率。Valkey 是单线程的,因此您可以使用此指标分析进程本身的负载。 Average Percentage
Database Capacity Usage Counted for Evict Percentage 集群正在使用的总数据容量百分比,不包括用于开销和缓存无关(COB)的内存。 Average Percentage
Database Memory Usage Counted For Evict Percentage 集群正在使用的内存百分比,不包括用于开销和 COB 的内存。 Average Percentage

Elasticache Valkey Cluster Shard

以下是 Elasticache Valkey Cluster Shard 监视器支持的指标。

指标名称 描述 统计 单位

Total number of nodes

分片(节点组)中的节点总数。

Sum

Count

Engine CPU Utilization

提供分片的 Valkey 引擎线程的 CPU 利用率。

Average

Percentage

Database Capacity Usage Counted For Evict Percentage

分片正在使用的总数据容量百分比,不包括用于开销和 COB 的内存。

Average

Percentage

Database Memory Usage Counted For Evict Percentage

分片正在使用的内存百分比,不包括用于开销和 COB 的内存。

Average

Percentage

Elasticache Valkey Cluster Node

以下是 Elasticache Valkey Cluster Node 监视器支持的指标。

指标名称 描述 统计 单位

CPU Utilization

整个节点的 CPU 利用率百分比。

Average

Percentage

CPU Credit Balance

实例自启动或开始以来累积的 CPU 积分数量。对于 T2 Standard,CPUCreditBalance 还包括已累积的启动积分数量。

Sum

Credits

CPU Credit Usage

实例用于 CPU 利用率所消耗的 CPU 积分数量。

Sum

Credits

Freeable Memory

主机上可用的空闲内存量。这是从操作系统报告为可释放的 RAM、缓冲区和缓存中得出的。

Average

Bytes

Network Bytes In

主机从网络读取的字节数。

Average

Bytes

Network Bytes Out

实例通过所有网络接口发送的字节数。

Average

Bytes

Network Packets In

实例通过所有网络接口接收的数据包数量。此指标以单个实例的数据包数量来衡量入站流量的大小。

Average

Count

Network Packets Out

实例通过所有网络接口发送的数据包数量。此指标以单个实例的数据包数量来衡量出站流量的大小。

Sum

Count

Network Bandwidth In Allowance Exceeded

由于入站聚合带宽超过实例上限而被排队或丢弃的数据包数量。

Sum

Count

Network Conntrack Allowance Exceeded

由于连接跟踪超过实例上限且无法建立新连接而丢弃的数据包数量。这可能导致进出实例的流量出现丢包。

Sum

Count

Network Bandwidth Out Allowance Exceeded

由于出站聚合带宽超过实例上限而被排队或丢弃的数据包数量。

Sum

Count

Network Packets Per Second Allowance Exceeded

由于双向每秒数据包数超过实例上限而被排队或丢弃的数据包数量。

Sum

Count

Network Max Bytes In

每分钟内接收字节数的最大每秒突发值。

Average

Bytes

Network Max Bytes Out

每分钟内发送字节数的最大每秒突发值。

Average

Bytes

Network Max Packets In

每分钟内接收数据包数的最大每秒突发值。

Sum

Count

Network Max Packets Out

每分钟内发送数据包数的最大每秒突发值。

Sum

Count

Swap Usage

主机上使用的交换内存量。

Average

Bytes

Active Defrag Hits

主动碎片整理进程每分钟执行的值重新分配次数。

Sum

Count

Authentication Failures

使用 AUTH 命令向 Valkey 进行身份验证失败的总次数。

Sum

Count

Bytes Used For Cache

Valkey 为所有目的分配的字节总数,包括数据集缓冲区等。

Average

Bytes

Bytes Read From Disk

每分钟从磁盘读取的总字节数。

Average

Bytes

Bytes Written To Disk

每分钟写入磁盘的总字节数。

Average

Bytes

Cache Hits

主字典中成功的只读键查找次数。

Sum

Count

Cache Misses

主字典中失败的只读键查找次数。

Sum

Count

Command Authorization Failures

用户尝试运行无权限命令的失败总次数。

Sum

Count

Cache Hit Rate

表示 Valkey 实例的使用效率。如果缓存比率低于约 0.8,意味着大量键被驱逐、过期或不存在。

Average

Percentage

Channel Authorization Failures

用户尝试访问无权限频道的失败总次数。

Sum

Count

Current Connections

客户端连接数,不包括来自只读副本的连接。

Sum

Count

Current Items

缓存中的项目数量。这是从键空间统计得出的,汇总了整个键空间中的所有键。

Sum

Count

Current Volatile Items

所有数据库中设置了 TTL(存活时间)的键总数。这是从过期统计得出的,汇总了整个键空间中所有设置了 TTL 的键。

Sum

Count

Database Capacity Usage Percentage

集群正在使用的总数据容量百分比。

Average

Percentage

Database Memory Usage Percentage

集群正在使用的内存百分比。

Average

Percentage

DB0 Average TTL

从 Valkey 命令的键空间统计中获取数据库 0(DB0)的 avg_ttl。

Average

Milliseconds

Evictions

由于 maxmemory 限制而被驱逐的键数量。

Sum

Count

Global Datastore Replication Lag

辅助区域的主节点与主区域的主节点之间的延迟。对于启用了集群模式的 Valkey,延迟表示分片之间的最大延迟。

Average

Seconds

IAM Authentication Expirations

IAM 认证的 Valkey 连接过期总数。

Sum

Count

IAM Authentication Throttling

IAM 认证的 Valkey AUTH 或 HELLO 请求被限流的总数。

Sum

Count

Key Authorization Failures

用户尝试访问无权限键的失败总次数。

Sum

Count

Keys Tracked

Valkey 键追踪正在追踪的键数量,以 tracking-table-max-keys 的百分比表示。键追踪用于辅助客户端缓存,并在键被修改时通知客户端。

Sum

Count

Memory Fragmentation Ratio

表示 Valkey 引擎内存分配的效率。特定阈值表示不同的行为。

Average

Count

New Connections

此期间服务器接受的连接总数。

Sum

Count

Number of Items Read From Disk

每分钟从磁盘检索的项目总数。

Sum

Count

Number of Items Written To Disk

每分钟写入磁盘的项目总数。

Sum

Count

Reclaimed

键过期事件的总数。

Sum

Count

Replication Bytes

对于复制配置中的节点,Replication Bytes 报告主节点发送给所有副本的字节数。

Average

Bytes

Replication Lag

此指标仅适用于作为只读副本运行的节点。它表示副本在应用来自主节点的变更时落后的秒数。

Average

Seconds

Successful Write Request Latency

成功写入请求的延迟。

Average

Microseconds

Successful Read Request Latency

成功读取请求的延迟。

Average

Microseconds

Error Count

指定时间段内失败命令的总数。

Sum

Count

Cluster Based Commands

基于集群的命令总数。通过汇总 commandstats 统计中作用于集群的所有命令得出(cluster slot、cluster info 等)。

Sum

Count

Cluster Based Commands Latency

基于集群的命令的延迟。

Average

Microseconds

Eval Based Commands

eval 类命令的总数。

Sum

Count

Eval Based Commands Latency

基于 eval 命令的延迟。

平均值

微秒

Geo Spatial Based Commands

地理空间命令的总数。该指标来自 commandstats 统计信息,通过对所有地理类型命令求和得出,包括:geoadd geodist geohashgeoposgeoradiusgeoradiusbymember

总和

次数

Geo Spatial Based Commands Latency

地理空间命令的延迟。

平均值

微秒

Get Type Commands

只读类型命令的总数。该指标来自 commandstats 统计信息,通过对所有只读类型命令求和得出(get hget scardlrange 等)。

总和

次数

Get Type Commands Latency

读命令的延迟。

平均值

微秒

Hash Based Commands

基于哈希的命令总数。该指标来自 commandstats 统计信息,通过对所有作用于一个或多个哈希的命令求和得出(hget hkeys hvalshdel 等)。

总和

次数

Hash Based Commands Latency

基于哈希命令的延迟。

平均值

微秒

HyperLog Log Based Commands

基于 HyperLogLog 命令的总数。该指标来自 commandstats 统计信息,通过对所有 pf 类型命令求和得出(pfadd pfcount pfmerge 等)。

总和

次数

HyperLog Log Based Commands Latency

基于 HyperLogLog 命令的延迟。

平均值

微秒

JSON Based Commands

JSON 命令(包括读和写命令)的总数。该指标来自 commandstats 统计信息,通过对所有作用于 JSON 键的 JSON 命令求和得出。

总和

次数

JSON Based Commands Latency

所有 JSON 命令(包括读和写命令)的延迟。

平均值

微秒

JSON Based Get Commands

JSON 只读命令的总数。该指标来自 commandstats 统计信息,通过对所有作用于 JSON 键的 JSON 读命令求和得出。

总和

次数

JSON Based Get Commands Latency

JSON 只读命令的延迟。

平均值

微秒

JSON Based Set Commands

JSON 写命令的总数。该指标来自 commandstats 统计信息,通过对所有作用于 JSON 键的 JSON 写命令求和得出。

总和

次数

JSON Based Set Commands Latency

JSON 写命令的延迟。

平均值

微秒

Key Based Commands

基于键的命令总数。该指标来自 commandstats 统计信息,通过对所有作用于跨多个数据结构的一个或多个键的命令求和得出(del expire rename 等)。

总和

次数

Key Based Commands Latency

基于键命令的延迟。

平均值

微秒

List Based Commands

基于列表的命令总数。该指标来自 commandstats 统计信息,通过对所有作用于一个或多个列表的命令求和得出(lindex lrange lpushltrim 等)。

总和

次数

List Based Commands Latency

基于列表命令的延迟。

平均值

微秒

Non Key Type Commands

非键类型命令的总数。该指标来自 commandstats 统计信息,通过对所有不作用于键的命令求和得出,例如 acl dbsize info

总和

次数

Non Key Type Commands Latency

非键类型命令的延迟。

平均值

微秒

PubSub Based Commands

发布/订阅功能命令的总数。该指标来自 commandstats 统计信息,通过对所有用于发布/订阅功能的命令求和得出:psubscribe publish pubsubpunsubscribessubscribesunsubscribespublishsubscribeunsubscribe

总和

次数

PubSub Based Commands Latency

基于发布/订阅命令的延迟。

平均值

微秒

Set Based Commands

基于集合的命令总数。该指标来自 commandstats 统计信息,通过对所有作用于一个或多个集合的命令求和得出(scard sdiff saddsunion 等)。

总和

次数

Set Based Commands Latency

基于集合命令的延迟。

平均值

微秒

Set Type Commands

写类型命令的总数。该指标来自 commandstats 统计信息,通过对所有对数据执行变更操作的命令类型求和得出(set hset saddlpop 等)。

总和

次数

Set Type Commands Latency

写命令的延迟。

平均值

微秒

Sorted Set Based Commands

基于有序集合的命令总数。该指标来自 commandstats 统计信息,通过对所有作用于一个或多个有序集合的命令求和得出(zcount zrange zrankzadd 等)。

总和

次数

Sorted Set Based Commands Latency

基于有序集合命令的延迟。

平均值

微秒

String Based Commands

基于字符串的命令总数。该指标来自 commandstats 统计信息,通过对所有作用于一个或多个字符串的命令求和得出(strlen setex setrange 等)。

总和

次数

String Based Commands Latency

基于字符串命令的延迟。

平均值

微秒

Stream Based Commands

基于流的命令总数。该指标来自 commandstats 统计信息,通过对所有作用于一个或多个流数据类型的命令求和得出(xrange xlen xaddxdel 等)。

总和

次数

Stream Based Commands Latency

基于流命令的延迟。

平均值

毫秒

阈值配置

为 Elasticache Valkey 监视器配置阈值:

  1. 登录 Site24x7 账户,导航至管理 > 配置文件 > 阈值与可用性
  2. 点击添加阈值配置文件
  3. 监视器类型下拉菜单中选择适用的监视器类型。可选的监视器类型包括:ElastiCache Valkey ServerlessElasticache Valkey ClusterElasticache Valkey Cluster ShardElasticache Valkey Cluster Node
  4. 显示名称字段中填写合适的名称。
  5. 支持的指标将显示在阈值配置部分。您可以为上述所有指标设置阈值。
  6. 点击保存

Elasticache Valkey Cluster 监视器中的状态传播

Site24x7 的 Elasticache Valkey 集成包含状态传播功能,确保子监视器的告警能够传播至父级 Elasticache Valkey Cluster 监视器。在编辑阈值配置文件页面上启用通知任何子监视器状态变化选项,可以简化 Elasticache Valkey Cluster 资源中告警的处理方式。

Elasticache Valkey Cluster Shard 和 Elasticache Valkey Cluster Node 等子监视器会将任何状态变化通知父级 Elasticache Valkey Cluster 监视器。这种传播机制帮助您维护所有告警的集中视图,并确保及时响应潜在问题。

例如,若 Valkey 集群中的某个分片或节点出现问题,由于子监视器已禁用告警,因此告警不会在子监视器级别显示。告警仅在父级 ElastiCache Valkey Cluster 监视器级别出现,且仅在启用状态传播并在子监视器标签页中完成所需配置的情况下才会生效。

许可证

  • 每个 Elasticache Valkey Serverless 监视器使用一个基础监视器许可证。
  • 每个 Elasticache Valkey Cluster 监视器使用一个基础监视器许可证。
  • 每个 Elasticache Valkey Cluster Shard 监视器为免费监视器。
  • 每个 Elasticache Valkey Cluster Node 使用一个基础监视器许可证。

查看 Amazon Elasticache Valkey 数据

要监控您的 Amazon Elasticache Valkey 环境,请登录 Site24x7 账户,导航至 > AWS > Amazon Elasticache Valkey

监视器数据

以下列出每个 Amazon Elasticache Valkey 监视器的监视器数据。

Elasticache Valkey Serverless

以下列出 Elasticache Valkey Serverless 监视器的监视器数据。

摘要

摘要标签页以图表形式提供事件时间线和指标的概述。

命令指标

命令指标标签页跟踪 ElastiCache Valkey 集群中随时间执行的专用命令或实用命令数量,帮助您了解命令使用模式并识别异常活动或性能问题。

配置

配置标签页显示受监控的 ElastiCache Valkey Serverless 监视器的所有关键配置详细信息,帮助您无需登录 AWS 控制台即可快速验证设置参数、连接信息和资源配置。

事件

事件标签页显示与 Valkey 无服务器缓存关联的事件。

备份

备份标签页显示与受监控的 ElastiCache Valkey Serverless 监视器关联的所有备份列表,提供备份名称类型(自动或手动)、状态缓存大小创建日期以及分片信息(如有)等详细信息。该标签页帮助您验证备份可用性、跟踪备份时间并确保其成功完成,同时通过集中展示所有备份活动来支持审计和灾难恢复需求。

中断

中断标签页提供中断的开始时间、结束时间、持续时间及备注(如有)的详细信息。

资源清单

资源清单标签页获取缓存名称区域监视器许可类别等详细信息。在此标签页中按用户设置和查看阈值与可用性配置文件以及通知配置文件

日志报表

此标签页提供 Elasticache Valkey Serverless 监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

此标签页按时间顺序显示与 Elasticache Valkey Serverless 监视器相关的所有已触发告警列表,帮助您追踪告警历史记录和严重程度,以评估问题并验证阈值设置。

Elasticache Valkey Cluster

以下列出 Elasticache Valkey Cluster 监视器的监视器数据。

摘要

摘要标签页以图表形式提供事件时间线和指标的概述。

分片

分片标签页显示集群中所有节点组(分片)的 ElastiCache Valkey Cluster Shard 监视器列表,以及其状态、监视器类型和可用操作。您可以通过点击操作选项(铅笔图标)为单个分片监视器配置阈值,或使用阈值配置按钮批量应用阈值。您也可以通过相同选项选择要接收告警的子监视器。要确保在子监视器状态变化时触发告警,请在 Cluster 监视器的阈值配置文件中启用通知任何子监视器状态变化选项。点击分片监视器可打开详细的 ElastiCache Valkey Cluster Shard 监视器页面。

节点

节点标签页列出集群中所有节点的 ElastiCache Valkey Cluster Node 监视器,以及其状态、监视器类型和可用操作。您可以通过点击操作选项(铅笔图标)为单个节点监视器配置阈值,或使用阈值配置按钮批量应用阈值。请确保在此标签页中为所需子监视器配置告警以接收通知。

此外,请确保在 Cluster 监视器的阈值配置文件中启用通知任何子监视器状态变化选项;除非开启该选项,否则不会触发告警。点击节点监视器可打开详细的 ElastiCache Valkey Cluster Node 监视器页面。

配置

配置标签页查看 Elasticache Valkey Cluster 监视器的配置信息,例如区域缓存名称缓存状态集群模式

备份

备份标签页显示与受监控的 ElastiCache Valkey Cluster 监视器关联的所有备份列表,提供备份名称类型(自动或手动)、状态缓存大小创建日期以及分片信息(如有)等详细信息。该标签页帮助您验证备份可用性、跟踪备份时间并确保其成功完成,同时通过集中展示所有备份活动来支持审计和灾难恢复需求。

服务更新

服务更新标签页查看与集群相关的所有服务更新。

中断

中断标签页提供中断的开始时间结束时间持续时间备注(如有)的详细信息。

资源清单

资源清单标签页获取缓存名称区域监视器许可类别等详细信息。在此标签页中按用户设置和查看阈值与可用性配置文件以及通知配置文件

日志报表

此标签页提供 Elasticache Valkey Cluster 监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

此标签页按时间顺序显示与 Elasticache Valkey Cluster 监视器相关的所有已触发告警列表,帮助您追踪告警历史记录和严重程度,以评估问题并验证阈值设置。

Elasticache Valkey Cluster Shard

以下列出 Elasticache Valkey Cluster Shard 监视器的监视器数据。

摘要

摘要标签页以图表形式提供事件时间线和指标的概述。

节点

节点标签页列出分片中所有节点的 ElastiCache Valkey Cluster Node 监视器,以及其状态、监视器类型和可用操作。您可以通过点击操作选项(铅笔图标)为单个节点监视器配置阈值,或使用阈值配置按钮批量应用阈值。请确保在此标签页中为所需子监视器配置告警以接收通知。

此外,请确保在 Cluster 监视器的阈值配置文件中启用通知任何子监视器状态变化选项;除非开启该选项,否则不会触发告警。点击节点监视器可打开详细的 ElastiCache Valkey Cluster Node 监视器页面。

配置

配置标签页查看 Elasticache Valkey Cluster Shard 监视器的配置信息,例如区域缓存名称节点组 ID分片状态

中断

中断标签页提供中断的开始时间结束时间持续时间备注(如有)的详细信息。

资源清单

资源清单标签页获取缓存名称区域监视器许可类别等详细信息。在此标签页中按用户设置和查看阈值与可用性配置文件以及通知配置文件

日志报表

此标签页提供 Elasticache Valkey Cluster Shard 监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

此标签页按时间顺序显示与 Elasticache Valkey Cluster Shard 监视器相关的所有已触发告警列表,帮助您追踪告警历史记录和严重程度,以评估问题并验证阈值设置。

Elasticache Valkey Cluster Node

以下列出 Elasticache Valkey Cluster Node 监视器的监视器数据。

摘要

摘要标签页以图表形式提供事件时间线和指标的概述。

Valkey 指标

Valkey 指标标签页提供 Valkey 集群或节点的关键运营指标,帮助您实时监控内存效率和安全相关故障。

命令指标

命令指标标签页跟踪 ElastiCache Valkey 集群节点中随时间执行的专用命令或实用命令数量,帮助您了解命令使用模式并识别异常活动或性能问题。

配置

配置标签页查看 Elasticache Valkey Cluster Node 监视器的配置信息,例如区域缓存名称引擎名称缓存节点名称

中断

中断标签页提供中断的开始时间结束时间持续时间备注(如有)的详细信息。

资源清单

资源清单标签页获取缓存名称区域监视器许可类别等详细信息。在此标签页中按用户设置和查看阈值与可用性配置文件以及通知配置文件

日志报表

此标签页提供 Elasticache Valkey Cluster Node 监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

此标签页按时间顺序显示与 Elasticache Valkey Cluster Node 监视器相关的所有已触发告警列表,帮助您追踪告警历史记录和严重程度,以评估问题并验证阈值设置。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!