Amazon ElastiCache 监控集成
Amazon ElastiCache 是云端的内存数据存储,可加速查询处理,并有助于提升应用程序的延迟和吞吐量。通过 Site24x7 的 CloudWatch 集成,您可以对 Redis 和 Memcached 引擎的重要指标进行可视化、监控和告警。
设置与配置
- 如果尚未完成,请通过将 Site24x7 创建为 IAM 用户,或在您的 AWS 账户与 Site24x7 的 AWS 账户之间创建跨账户 IAM 角色来启用对 AWS 资源的访问。了解更多。
- 在集成 AWS 账户页面,确保勾选了 ElastiCache 列表旁边的复选框。了解更多。
策略与权限
Site24x7 需要以下权限来发现您配置的 Redis/Memcached 节点和 Memcached 集群,并收集配置信息。
- "elasticache:DescribeCacheClusters",
- "elasticache:DescribeCacheSubnetGroups",
- "elasticache:ListTagsForResource",
- "elasticache:DescribeServiceUpdates",
- "elasticache:DescribeReplicationGroups"
- "elasticache:DescribeCacheClusters",
- "elasticache:DescribeCacheSubnetGroups",
- "elasticache:ListTagsForResource",
- "elasticache:DescribeServiceUpdates"
- "elasticache:DescribeCacheClusters",
- "elasticache:DescribeCacheSubnetGroups",
- "elasticache:ListTagsForResource",
- "elasticache:DescribeServiceUpdates"
轮询频率
Site24x7 根据配置的轮询频率查询 AWS 以收集 AWS ElastiCache 性能指标,默认轮询间隔为一小时。了解更多
IT 自动化
您可以为 Site24x7 支持的 AWS 服务添加自动化操作。登录 Site24x7 并前往管理 > IT 自动化模板(+)> 添加自动化模板。添加自动化后,您可以安排它们按顺序依次执行。
您现在可以使用 Amazon ElastiCache 自动化重启 ElastiCache 集群。
支持的性能计数器
主机级数据
以下主机级数据将被收集:
| 属性 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| CPU 利用率 | 衡量主机的 CPU 利用率。 | 平均值、最小值和最大值 | 百分比 |
| 可用内存 | 衡量主机中可用的空闲内存量。 | 平均值、最小值和最大值 | 字节 |
| 网络入站字节数 | 衡量主机从网络读取的字节数。 | 平均值、最小值和最大值 | 字节 |
| 网络出站字节数 | 衡量主机写入网络的字节数。 | 平均值、最小值和最大值 | 字节 |
| 交换区使用量 | 衡量主机使用的交换区大小。 | 平均值、最小值和最大值 | 字节 |
通用缓存指标
以下数据同时支持 Redis 和 Memcached:
| 属性 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| CurrConnections | 连接到 Redis/Memcached 的应用程序客户端数量。 | 平均值、总和 | 数量 |
| CurrItems | 内存数据库中的键数量。 | 平均值、总和 | 数量 |
| Evictions | 因达到最大内存限制而被移除的键数量。 | 平均值、总和 | 数量 |
| NewConnections | 数据库服务器已接受的连接总数。 | 平均值、总和 | 数量 |
Redis 缓存引擎支持的指标
以下数据仅针对 Redis 节点收集:
| 属性 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| ActiveDefragHits | 主动碎片整理进程每分钟执行的值重分配次数。 | 平均值 | 数量 |
| AuthenticationFailures | 使用 AUTH 命令进行 Redis 身份验证的失败尝试总次数。 | 最大值 | 数量 |
| BytesReadFromDisk | 每分钟从磁盘读取的总字节数。 | 总和 | MB |
| BytesUsedForCache | Redis 分配的字节数。 | 平均值 | 字节 |
| BytesWrittenToDisk | 每分钟写入磁盘的总字节数。 | 总和 | MB |
| CacheHits | 成功的键空间查找次数。 | 总和 | 数量 |
| CacheMisses | 未命中的键空间查找次数。 | 总和 | 数量 |
| CacheHitRate | 表示 Redis 实例的使用效率。 | 平均值 | 百分比 |
| CommandAuthorizationFailures | 用户尝试运行无权调用的命令的失败次数总计。 | 最大值 | 数量 |
| CurrVolatileItems | 所有数据库中设置了生存时间(TTL)的键的总数。 | 最大值 | 数量 |
| DatabaseMemoryUsagePercentage | 集群可用内存中正在使用的百分比。 | 最大值 | 百分比 |
| DatabaseMemoryUsageCountedForEvictPercentage | 集群可用内存中正在使用的百分比,不包括用于开销和客户端输出缓冲区(COB)的内存。 | 最大值 | 百分比 |
| DB0AverageTTL | 公开键空间统计信息中 DBO 的 avg_ttl。 | 平均值 | 毫秒 |
| EngineCPUUtilization | 提供 Redis 引擎线程的 CPU 利用率。 | 最大值 | 百分比 |
| GetTypeCmds | Get 类型命令的总数。 | 总和 | 数量 |
| GlobalDatastoreReplicationLag | 辅助区域主节点与主区域主节点之间的延迟。 | 平均值 | 秒 |
| HashBasedCmds | 基于哈希的命令总数。 | 总和 | 数量 |
| HyperLogLogBasedCmds | 基于 HyperLogLog 的命令总数。 | 总和 | 数量 |
| KeyAuthorizationFailures | 用户尝试访问无权访问的键的失败次数总计。 | 最大值 | 数量 |
| KeyBasedCmds | 基于键的命令总数。 | 总和 | 数量 |
| KeysTracked | Redis 键追踪正在追踪的键数量,以 tracking-table-max-keys 的百分比表示。 | 最大值 | 数量 |
| ListBasedCmds | 基于列表的命令总数。 | 总和 | 数量 |
| MemoryFragmentationRatio | 表示 Redis 引擎内存分配的效率。 | 最小值 | 数量 |
| NumItemsReadFromDisk | 每分钟从磁盘检索的总项目数。 | 总和 | 数量 |
| NumItemsWrittenToDisk | 每分钟写入磁盘的总项目数。 | 总和 | 数量 |
| Reclaimed | 键过期事件的总数。 | 总和 | 数量 |
| ReplicationBytes | 主节点向所有副本发送的总字节数。 | 总和 | 数量 |
| ReplicationLag | 只读副本在应用主节点更改方面落后的时间(秒)。 | 平均值 | 秒 |
| SaveInProgress | 每当后台保存正在进行时,该指标递增。 | 总和 | 数量 |
| SetBasedCmds | 基于集合的命令总数。 | 总和 | 数量 |
| SetTypeCmds | Set 类型命令的总数。 | 总和 | 数量 |
| SortedSetBasedCmds | 基于有序集合的命令总数。 | 总和 | 数量 |
| StringBasedCmds | 基于字符串的命令总数。 | 总和 | 数量 |
| ClusterBasedCmdsLatency | 基于集群命令的延迟。 | 最大值 | 微秒 |
| EvalBasedCmdsLatency | 基于 eval 命令的延迟。 | 最大值 | 微秒 |
| GeoSpatialBasedCmdsLatency | 基于地理空间命令的延迟。 | 最大值 | 微秒 |
| GetTypeCmdsLatency | 读取命令的延迟。 | 最大值 | 微秒 |
| HashBasedCmdsLatency | 基于哈希命令的延迟。 | 最大值 | 微秒 |
| HyperLogLogBasedCmdsLatency | 基于 HyperLogLog 命令的延迟。 | 最大值 | 微秒 |
| JsonBasedCmdsLatency | 公开作用于一个或多个 JSON 文档对象的所有命令的聚合延迟(服务器端 CPU 时间),计算方式为 Delta[Usec]/Delta[Calls]。 | 最大值 | 微秒 |
| KeyBasedCmdsLatency | 基于键命令的延迟。 | 最大值 | 微秒 |
| ListBasedCmdsLatency | 基于列表命令的延迟。 | 最大值 | 微秒 |
| PubSubBasedCmdsLatency | 基于发布/订阅命令的延迟。 | 最大值 | 微秒 |
| SetBasedCmdsLatency | 基于集合命令的延迟。 | 最大值 | 微秒 |
| SetTypeCmdsLatency | 写入命令的延迟。 | 最大值 | 微秒 |
| SortedSetBasedCmdsLatency | 基于有序集合命令的延迟。 | 最大值 | 微秒 |
| StringBasedCmdsLatency | 基于字符串命令的延迟。 | 最大值 | 微秒 |
| StreamBasedCmdsLatency | 基于流命令的延迟。 | 最大值 | 微秒 |
| NetworkBytesIn | 主机从网络读取的字节数。 | 总和 | MB |
| NetworkBytesOut | 实例通过所有网络接口发送的字节数。 | 总和 | MB |
| NetworkPacketsIn | 实例通过所有网络接口接收的数据包数量。此指标以数据包数量来衡量单个实例上的入站流量。 | 总和 | MB |
| NetworkPacketsOut | 实例通过所有网络接口发送的数据包数量。此指标以数据包数量来衡量单个实例上的出站流量。 | 总和 | MB |
Memcached 引擎支持的指标
Site24x7 收集 Memcached 节点的以下性能数据,并对各节点的值进行聚合,同时为 Memcached 集群提供计算后的指标。
| 属性 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| BytesReadIntoMemcached | 节点从网络读取的总字节数。 | 平均值 | 字节 |
| BytesUsedForCacheItems | 用于存储缓存项的总字节数。 | 平均值 | 字节 |
| BytesWrittenOutFromMemcached | 节点写入网络的总字节数。 | 平均值 | 字节 |
| CasBadval | 缓存收到的检查并设置请求总数(其中 Cas 值不匹配)。 | 总和 | 数量 |
| CasHits | 缓存收到的检查并设置请求总数(其中键和值均匹配)。 | 总和 | 数量 |
| CasMisses | 缓存收到的检查并设置请求总数(其中未找到键)。 | 总和 | 数量 |
| CmdFlush | 收到的 Flush 命令数量。 | 总和 | 数量 |
| CmdGet | 收到的 Get 命令数量。 | 总和 | 数量 |
| CmdSet | 收到的 Set 命令数量。 | 总和 | 数量 |
| DecrHits | 缓存收到的递减请求数量(其中键匹配)。 | 总和 | 数量 |
| DecrMisses | 缓存收到的递减请求数量(其中未找到键)。 | 总和 | 数量 |
| DeleteHits | 缓存收到的删除请求数量(其中键匹配)。 | 总和 | 数量 |
| DeleteMisses | 缓存收到的删除请求数量(其中未找到键)。 | 总和 | 数量 |
| GetHits | 缓存收到的 Get 请求数量(其中找到了请求的键)。 | 总和 | 数量 |
| GetMisses | 缓存收到的 Get 请求数量(其中未找到键)。 | 总和 | 数量 |
| IncrHits | 缓存收到的递增请求数量(其中找到了键)。 | 总和 | 数量 |
| IncrMisses | 缓存收到的递增请求数量(其中未找到键)。 | 总和 | 数量 |
| Reclaimed | 缓存为支持新写入而驱逐的过期项数量。 | 总和 | 数量 |
为 ElastiCache 添加或编辑阈值配置文件
Site24x7 支持为 Memcached 集群、Memcached 节点和 Redis 节点分别设置独立的阈值配置文件。如需了解如何为 ElastiCache 部署创建、编辑和删除阈值配置文件,请访问配置文件页面。
已监控资源
查看与您的 ElastiCache 监视器关联的已监控资源列表。点击单个列表项可查看该资源的状态、类型和资源 ID。您还可以通过点击操作列下的铅笔图标来设置阈值,并在任何资源发生故障时接收通知。
预测
估算以下 Amazon ElastiCache Memcached 节点、Memcached 集群和 ElastiCache Redis 性能指标的未来值,以便就增加容量或扩展 AWS 基础架构做出明智决策。
- CPU 利用率
- 驱逐数
- 回收数
- 连接数
- CurrConnections
- 交换区使用量
