帮助手册

Azure Cosmos DB for NoSQL 监控集成

Azure Cosmos DB for NoSQL 是一种非关系型服务,可原生存储具有灵活架构的 JSON 文档。

借助 Site24x7 的集成支持,您可以使用精准指标监控数据库、配置阈值,并在发生阈值超出时立即收到告警。

设置与配置

在配置新 Azure 监视器时添加 Azure Cosmos DB for NoSQL

如果您尚未配置 Azure 监视器,请按照以下步骤添加:

  1. 登录您的 Site24x7 账户。
  2. 从左侧导航窗格中选择,然后选择 Azure > 添加 Azure 监视器。您也可以按照这些步骤添加 Azure 监视器
  3. 在 Azure 监视器配置过程中,在添加 Azure 监视器页面,从服务/资源类型下拉列表中选择 Azure Cosmos DB for NoSQL 及其他所需资源类型。请确认在编辑页面中已配置对应的资源组和标签过滤器。

将 Azure Cosmos DB for NoSQL 添加到现有 Azure 监视器

如果您已为租户配置了 Azure 监视器,可以按照以下步骤添加 Azure Cosmos DB for NoSQL:

  1. 登录您的 Site24x7 账户。
  2. 进入 > Azure > 从左侧窗格中选择要添加 Azure Cosmos DB for NoSQL 的 Azure 监视器。
  3. 服务视图页面,单击 Azure Cosmos DB for NoSQL 服务类型中的启用监控按钮。请确认在编辑页面中已配置对应的资源组和标签过滤器。 
注意

发现新 Azure 资源需要 15-30 分钟。如需立即发现所选配置,请单击右上角的立即发现,这将发现所有符合 Azure编辑页面中配置过滤条件的资源,即使自动发现新资源选项已禁用。 

现在,您可以直接从服务视图仪表板查看已发现的数据库。

轮询频率

Site24x7 的 Azure Cosmos DB for NoSQL 监视器每分钟收集一次指标数据,每五分钟从您的应用程序收集一次状态信息。

支持的指标

使用情况

指标 描述 统计方式 单位
Service Availability 账户在一小时、一天或一个月粒度下的可用性请求百分比。 平均值 Percent
Metadata Requests 元数据请求的数量。Cosmos DB 为每个账户维护一个系统元数据集合,允许用户免费枚举集合、数据库等及其配置。 Count Count
Data Usage 以五分钟粒度报告的总数据使用量。 平均值 Bytes
Index Usage 以五分钟粒度报告的总索引使用量。 平均值 Bytes
Document Count 以五分钟、一小时和一天粒度报告的总文档数量。 平均值 Count
Document Quota 以五分钟粒度报告的总存储配额。 平均值 Bytes
Account Created 已创建的账户数量。 Count Count
Account Deleted 已删除的账户数量。 Count Count
Total Requests 发出的请求总数。 Count Count
Total Request Units 已消耗的 SQL 请求单位数量。 平均值 Count
Normalized RU Consumption 每分钟消耗的最大 RU 百分比。 平均值 Percent
Autoscaled RU 每个区域和每个分区自动扩展消耗的自动扩展 RU 数量。 最大值 Count
Account Keys Updated 已更新的账户密钥数量。  Count Count
Account Network Settings Updated 已更新的账户网络设置数量。  Count Count
Autoscale Max Throughput 特定数据库中自动扩展的吞吐量数量。  最大值 Count
Provisioned Throughput 已预置的吞吐量数量。 最大值 Count
Account Replication Settings Updated 已更新的账户复制设置数量。  Count Count
Account Diagnostic Settings Updated 已更新的账户诊断设置数量。  Count Count
Materialized View Catchup Gap In Minutes 源容器中的数据与传播到物化视图的数据之间的最大时间差(分钟)。 最大值 Count
Materialized Views Builder Average CPU Usage 用于在物化视图中填充数据的物化视图构建器实例的平均 CPU 使用率。 平均值 Percent
Materialized Views Builder Average Memory Usage 用于在物化视图中填充数据的物化视图构建器实例的平均内存使用量。 平均值 Bytes
Materialized Views Builder Maximum CPU Usage 用于在物化视图中填充数据的物化视图构建器实例的平均最大 CPU 使用率。 平均值 Percent

弹性 

指标 描述 统计方式 单位
Server Side Latency 服务器端记录的延迟量。  平均值 Milliseconds
Server Side Latency Direct 直连模式下服务器端记录的延迟量。 平均值 Milliseconds
Server Side Latency Gateway 网关连接模式下服务器端记录的延迟量。 平均值 Milliseconds
Physical Partition Count 物理分区的数量。  最大值 Count
Physical Partition Size 物理分区的大小。 平均值 Bytes
Physical Partition Throughput 物理分区吞吐量的数量。 最大值 Count
Region Added 已添加的区域数量。 Count Count
Region Removed 已移除的区域数量。 Count Count
Region Offlined 已下线的区域数量。 Count Count
Region Onlined 已上线的区域数量。 Count Count
Region Failed Over 已发生故障转移的区域数量。 Count Count
P99 Replication Latency 启用地理位置的账户中源区域和目标区域之间的 P99 复制延迟量。 平均值 Milliseconds

专用网关 

指标 描述 统计方式 单位
Dedicated Gateway Average CPU Usage 专用网关实例的平均 CPU 使用率。 平均值 Percent
Dedicated Gateway Average Memory Usage 专用网关实例的平均内存使用量,用于路由请求和缓存数据。 平均值 Bytes
Dedicated Gateway CPU Usage 专用网关实例的 CPU 使用量。 平均值 Percent
Dedicated Gateway Maximum CPU Usage 专用网关实例的平均最大 CPU 使用率。 平均值 Percent
Dedicated Gateway Memory Usage 专用网关实例的平均内存使用量。 平均值 Bytes
Dedicated Gateway Requests 专用网关的请求数量。 Count Count
Integrated Cache Evicted Entries Size 从集成缓存中驱逐的条目的平均大小。 平均值 Bytes
Integrated Cache Item Expiration Count 由于存活时间(TTL)到期而从集成缓存中驱逐的项目数量。 平均值 Count
Integrated Cache Item Hit Rate 通过集成缓存完成的点读取数量占通过专用网关路由(最终一致性)的点读取总数的百分比。 平均值 Percent
Integrated Cache Query Expiration Count 由于 TTL 到期而从集成缓存中驱逐的查询数量。 平均值 Count
Integrated Cache Query Hit Rate 通过集成缓存完成的查询数量占通过专用网关路由(最终一致性)的查询总数的百分比。 平均值 Percent

阈值配置

可以从监视器编辑页面关联阈值配置文件:

  • 配置文件 > 阈值和可用性 > 从下拉列表中选择对应的阈值配置文件。 
注意

对此阈值配置文件所做的更改将应用于所有关联的监视器。您可以通过单击 + 或 铅笔图标来添加或编辑阈值配置文件。

批量操作:

可以从管理页面批量关联阈值配置文件(管理 >  资源清单 > 批量操作 > 在监视器配置下,进入修改阈值配置文件)。

选择阈值和可用性选项,为指标设置阈值。您还可以在属性级别配置 IT 自动化

默认阈值

Site24x7 基于一组默认阈值向您发送告警。这些默认阈值确保数据库容量不会被过度使用,从而保持最佳存储和性能,同时有助于降低成本。以下指标提供默认阈值:

  • Public Network Access Changed
  • Default Consistency Policy Changed
  • Service Availability
  • Normalized RU Consumption
  • Account Keys Updated
  • Region Removed
  • SQL Container Created
  • SQL Container Updated
  • SQL Container Deleted
  • SQL Database Created
  • SQL Database Updated
  • SQL Database Deleted

IT 自动化

Site24x7 提供一套专属 IT 自动化工具,可自动解决性能下降问题。这些工具主动响应事件,而无需等待人工干预。

如何为监视器配置 IT 自动化。

配置规则

借助 Site24x7 的配置规则,您可以为多个监视器设置阈值配置文件、通知配置文件、标签和监视器组等参数。这些规则可以针对符合指定条件的现有或新增监视器(在添加时)进行配置和运行。

如何添加配置规则。

报表

通过我们深度洞察的报表,获取监控资源各项参数的详细数据,提升服务性能。

要查看 Azure Cosmos DB for NoSQL 的报表:

  • 进入左侧导航窗格中的报表部分。
  • 从左侧菜单中选择 Azure Cosmos DB for NoSQL

您可以查看一个所选监视器的可用性摘要报表性能报表,也可以获取所有监视器的资源清单报表摘要报表可用性摘要报表健康趋势报表性能报表

定期报表

您还可以通过进入报表 > Azure Cosmos DB for NoSQL > 资源清单报表并单击右上角的分享按钮来定期发送资源清单报表。在定期报表弹出窗口中,选择监视器,设置所需频率(每日、每周、每月或每季度),并将定期的资源清单详情报表发送到您希望的用户组。

Site24x7 Azure Cosmos DB for NoSQL 监控还提供按默认一致性级别分类的 CosmosDB for NoSQL 报表,助您深入了解资源情况。 

Top N 和 Bottom N 报表

  • Service Availability
  • Normalized RU Consumption
  • Data Usage
  • Index Usage
  • Document Count
  • Total Requests
  • Provisioned Throughput

您也可以从 Azure Cosmos DB for NoSQL 监视器的 使用情况选项卡查看报表。

  • 进入 Azure Cosmos DB for NoSQL 监视器的 使用情况选项卡,单击可用性,获取监视器的可用性摘要报表
  • 您还可以通过单击任意图表标题,查看监视器的 性能报表

Site24x7 Cosmos DB for NoSQL 监控界面

概览您 Cosmos DB for NoSQL 的可用性和使用状态。

使用情况

使用情况选项卡帮助您查看资源的数据和索引使用情况,以及服务和数据库的可用性状态。您可以查看 Metadata RequestsNormalized RU ConsumptionProvisioned Throughput 等众多指标。

弹性

通过弹性选项卡,您可以查看延迟详情、分区信息和区域状态。

SQL

SQL 选项卡提供 SQL 数据库和容器的详细信息,以及吞吐量信息。

专用网关

专用网关选项卡包含专用网关请求信息、集成缓存详情,以及 CPU 和内存使用情况信息。

配置详情

配置详情选项卡提供 Cosmos DB for NoSQL 的配置详情,包括 SQL EndPointPublic Network AccessDefault Consistency LevelBackup Policy TypeAutomatic Failover 等信息。

Zia 预测:

借助 AI 驱动的 Zia 框架,您可以通过 Zia 预测选项卡中的预测图表查看资源消耗情况。该图表基于 7 天历史数据分析预测未来性能指标,提供未来七天预期指标使用情况的洞察。

中断

中断选项卡提供 Cosmos DB for NoSQL 状态的历史记录,包括宕机、告警和严重状态。

资源清单

清单选项卡提供许可证详情、已设置的阈值和可用性配置文件、已设置的通知配置文件、已设置的用户告警组,以及监视器的创建时间和修改时间。

日志报表:

日志报表选项卡列出每次数据采集期间收集的所有日志及其状态。

相关链接:

如何添加 Azure 监视器
如何集成 Azure App Service 监视器
如何集成 Azure 虚拟机监视器
如何为监视器配置 IT 自动化
如何添加配置规则

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!