帮助手册

Amazon ElastiCache 监控集成

Amazon ElastiCache 是云端的内存数据存储,可加速查询处理,并有助于提升应用程序的延迟和吞吐量。通过 Site24x7 的 CloudWatch 集成,您可以对 Redis 和 Memcached 引擎的重要指标进行可视化、监控和告警。

设置与配置

  • 如果尚未完成,请通过将 Site24x7 创建为 IAM 用户,或在您的 AWS 账户与 Site24x7 的 AWS 账户之间创建跨账户 IAM 角色来启用对 AWS 资源的访问。了解更多。
  • 集成 AWS 账户页面,确保勾选了 ElastiCache 列表旁边的复选框。了解更多。

策略与权限

Site24x7 需要以下权限来发现您配置的 Redis/Memcached 节点和 Memcached 集群,并收集配置信息。

  • "elasticache:DescribeCacheClusters",
  • "elasticache:DescribeCacheSubnetGroups",
  • "elasticache:ListTagsForResource",
  • "elasticache:DescribeServiceUpdates",
  • "elasticache:DescribeReplicationGroups"
  • "elasticache:DescribeCacheClusters",
  • "elasticache:DescribeCacheSubnetGroups",
  • "elasticache:ListTagsForResource",
  • "elasticache:DescribeServiceUpdates"
  • "elasticache:DescribeCacheClusters",
  • "elasticache:DescribeCacheSubnetGroups",
  • "elasticache:ListTagsForResource",
  • "elasticache:DescribeServiceUpdates"

轮询频率

Site24x7 根据配置的轮询频率查询 AWS 以收集 AWS ElastiCache 性能指标,默认轮询间隔为一小时。了解更多

IT 自动化

您可以为 Site24x7 支持的 AWS 服务添加自动化操作。登录 Site24x7 并前往管理 > IT 自动化模板(+)> 添加自动化模板。添加自动化后,您可以安排它们按顺序依次执行。

您现在可以使用 Amazon ElastiCache 自动化重启 ElastiCache 集群。

支持的性能计数器

主机级数据

以下主机级数据将被收集:

属性 描述 统计方式 单位
CPU 利用率 衡量主机的 CPU 利用率。 平均值、最小值和最大值 百分比
可用内存 衡量主机中可用的空闲内存量。 平均值、最小值和最大值 字节
网络入站字节数 衡量主机从网络读取的字节数。 平均值、最小值和最大值 字节
网络出站字节数 衡量主机写入网络的字节数。 平均值、最小值和最大值 字节
交换区使用量 衡量主机使用的交换区大小。 平均值、最小值和最大值 字节

通用缓存指标

以下数据同时支持 Redis 和 Memcached:

属性 描述 统计方式 单位
CurrConnections 连接到 Redis/Memcached 的应用程序客户端数量。  平均值、总和 数量
CurrItems 内存数据库中的键数量。  平均值、总和 数量
Evictions 因达到最大内存限制而被移除的键数量。 平均值、总和 数量
NewConnections 数据库服务器已接受的连接总数。  平均值、总和 数量

Redis 缓存引擎支持的指标

以下数据仅针对 Redis 节点收集:

属性 描述 统计方式 单位
ActiveDefragHits 主动碎片整理进程每分钟执行的值重分配次数。 平均值 数量
AuthenticationFailures 使用 AUTH 命令进行 Redis 身份验证的失败尝试总次数。 最大值 数量
BytesReadFromDisk 每分钟从磁盘读取的总字节数。 总和 MB
BytesUsedForCache Redis 分配的字节数。  平均值 字节
BytesWrittenToDisk 每分钟写入磁盘的总字节数。  总和 MB
CacheHits 成功的键空间查找次数。  总和 数量
CacheMisses 未命中的键空间查找次数。 总和 数量
CacheHitRate 表示 Redis 实例的使用效率。 平均值 百分比
CommandAuthorizationFailures 用户尝试运行无权调用的命令的失败次数总计。 最大值 数量
CurrVolatileItems 所有数据库中设置了生存时间(TTL)的键的总数。 最大值 数量
DatabaseMemoryUsagePercentage 集群可用内存中正在使用的百分比。  最大值 百分比
DatabaseMemoryUsageCountedForEvictPercentage 集群可用内存中正在使用的百分比,不包括用于开销和客户端输出缓冲区(COB)的内存。 最大值 百分比
DB0AverageTTL 公开键空间统计信息中 DBO 的 avg_ttl。 平均值 毫秒
EngineCPUUtilization 提供 Redis 引擎线程的 CPU 利用率。 最大值 百分比
GetTypeCmds Get 类型命令的总数。 总和 数量
GlobalDatastoreReplicationLag 辅助区域主节点与主区域主节点之间的延迟。 平均值
HashBasedCmds 基于哈希的命令总数。  总和 数量
HyperLogLogBasedCmds 基于 HyperLogLog 的命令总数。  总和 数量
KeyAuthorizationFailures 用户尝试访问无权访问的键的失败次数总计。  最大值 数量
KeyBasedCmds 基于键的命令总数。 总和 数量
KeysTracked Redis 键追踪正在追踪的键数量,以 tracking-table-max-keys 的百分比表示。 最大值 数量
ListBasedCmds 基于列表的命令总数。  总和 数量
MemoryFragmentationRatio 表示 Redis 引擎内存分配的效率。 最小值 数量
NumItemsReadFromDisk 每分钟从磁盘检索的总项目数。  总和 数量
NumItemsWrittenToDisk 每分钟写入磁盘的总项目数。 总和 数量
Reclaimed 键过期事件的总数。  总和  数量
ReplicationBytes 主节点向所有副本发送的总字节数。  总和 数量
ReplicationLag 只读副本在应用主节点更改方面落后的时间(秒)。 平均值
SaveInProgress 每当后台保存正在进行时,该指标递增。 总和 数量
SetBasedCmds 基于集合的命令总数。 总和 数量
SetTypeCmds Set 类型命令的总数。 总和 数量
SortedSetBasedCmds 基于有序集合的命令总数。 总和 数量
StringBasedCmds 基于字符串的命令总数。 总和  数量
ClusterBasedCmdsLatency 基于集群命令的延迟。 最大值 微秒
EvalBasedCmdsLatency 基于 eval 命令的延迟。 最大值 微秒
GeoSpatialBasedCmdsLatency 基于地理空间命令的延迟。 最大值 微秒
GetTypeCmdsLatency 读取命令的延迟。 最大值 微秒
HashBasedCmdsLatency 基于哈希命令的延迟。 最大值 微秒
HyperLogLogBasedCmdsLatency 基于 HyperLogLog 命令的延迟。 最大值 微秒
JsonBasedCmdsLatency 公开作用于一个或多个 JSON 文档对象的所有命令的聚合延迟(服务器端 CPU 时间),计算方式为 Delta[Usec]/Delta[Calls]。 最大值 微秒
KeyBasedCmdsLatency 基于键命令的延迟。 最大值 微秒
ListBasedCmdsLatency 基于列表命令的延迟。 最大值 微秒
PubSubBasedCmdsLatency 基于发布/订阅命令的延迟。 最大值 微秒
SetBasedCmdsLatency 基于集合命令的延迟。 最大值 微秒
SetTypeCmdsLatency 写入命令的延迟。 最大值 微秒
SortedSetBasedCmdsLatency 基于有序集合命令的延迟。 最大值 微秒
StringBasedCmdsLatency 基于字符串命令的延迟。 最大值 微秒
StreamBasedCmdsLatency 基于流命令的延迟。 最大值 微秒
NetworkBytesIn 主机从网络读取的字节数。 总和 MB
NetworkBytesOut 实例通过所有网络接口发送的字节数。 总和 MB
NetworkPacketsIn 实例通过所有网络接口接收的数据包数量。此指标以数据包数量来衡量单个实例上的入站流量。 总和 MB
NetworkPacketsOut 实例通过所有网络接口发送的数据包数量。此指标以数据包数量来衡量单个实例上的出站流量。 总和 MB

Memcached 引擎支持的指标

Site24x7 收集 Memcached 节点的以下性能数据,并对各节点的值进行聚合,同时为 Memcached 集群提供计算后的指标。

属性 描述 统计方式 单位
BytesReadIntoMemcached 节点从网络读取的总字节数。 平均值 字节
BytesUsedForCacheItems 用于存储缓存项的总字节数。 平均值  字节 
BytesWrittenOutFromMemcached 节点写入网络的总字节数。  平均值  字节
CasBadval 缓存收到的检查并设置请求总数(其中 Cas 值不匹配)。 总和  数量 
CasHits 缓存收到的检查并设置请求总数(其中键和值均匹配)。 总和  数量 
CasMisses 缓存收到的检查并设置请求总数(其中未找到键)。  总和  数量 
CmdFlush 收到的 Flush 命令数量。  总和  数量 
CmdGet 收到的 Get 命令数量。  总和  数量 
CmdSet 收到的 Set 命令数量。 总和  数量 
DecrHits 缓存收到的递减请求数量(其中键匹配)。  总和  数量 
DecrMisses 缓存收到的递减请求数量(其中未找到键)。 总和  数量 
DeleteHits 缓存收到的删除请求数量(其中键匹配)。   总和  数量 
DeleteMisses 缓存收到的删除请求数量(其中未找到键)。 总和  数量 
GetHits 缓存收到的 Get 请求数量(其中找到了请求的键)。  总和 数量 
GetMisses 缓存收到的 Get 请求数量(其中未找到键)。  总和  数量 
IncrHits 缓存收到的递增请求数量(其中找到了键)。   总和  数量 
IncrMisses 缓存收到的递增请求数量(其中未找到键)。   总和  数量 
Reclaimed 缓存为支持新写入而驱逐的过期项数量。 总和  数量 

为 ElastiCache 添加或编辑阈值配置文件

Site24x7 支持为 Memcached 集群、Memcached 节点和 Redis 节点分别设置独立的阈值配置文件。如需了解如何为 ElastiCache 部署创建、编辑和删除阈值配置文件,请访问配置文件页面

已监控资源

查看与您的 ElastiCache 监视器关联的已监控资源列表。点击单个列表项可查看该资源的状态、类型和资源 ID。您还可以通过点击操作列下的铅笔图标来设置阈值,并在任何资源发生故障时接收通知。

预测

估算以下 Amazon ElastiCache Memcached 节点、Memcached 集群和 ElastiCache Redis 性能指标的未来值,以便就增加容量或扩展 AWS 基础架构做出明智决策。

  • CPU 利用率
  • 驱逐数
  • 回收数
  • 连接数
  • CurrConnections
  • 交换区使用量

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!