帮助手册

Azure Data Explorer 集群监控集成

Azure Data Explorer 集群是一项完全托管的大数据分析服务,具有可扩展性和安全性。它使您能够实时分析大量结构化或非结构化数据,并获取关键趋势和预测模式的洞察。

借助 Site24x7 的集成,您现在可以监控 Data Explorer 集群,获取可靠指标、定义阈值,并在阈值超出时收到告警。

设置和配置

  • 在配置新 Azure 监视器时添加 Azure Data Explorer 集群

    如果您尚未配置 Azure 监视器,请按照以下步骤添加:

    1. 登录您的 Site24x7 账户。
    2. 在左侧导航窗格中单击云端,选择 Azure > 添加 Azure 监视器。您也可以按照以下步骤添加 Azure 监视器
    3. 添加 Azure 监视器页面的服务/资源类型下拉列表中选择 Azure Data Explorer 集群
  • 将 Azure Data Explorer 集群添加到现有 Azure 监视器

    如果您已为租户配置了 Azure 监视器,可以按照以下步骤添加 Azure Data Explorer 集群:

    1. 登录您的 Site24x7 账户。
    2. 进入云端 > Azure > 您的 Azure 监视器,然后从 Azure 监视器左侧窗格导航到任意仪表板。
    3. 单击汉堡 图标,然后单击编辑,进入编辑 Azure 监视器页面。
    4. 编辑 Azure 监视器页面,从下拉菜单中选择对应的订阅资源组,从服务/资源类型下拉列表中选择 Azure Data Explorer 集群,然后单击保存

成功配置后,进入云端 > Azure,从 Azure 监视器下拉列表中选择 Azure Data Explorer 集群。现在您可以查看已发现的 Azure Data Explorer 集群。

注意

新的 Azure 资源将在下一个发现周期中自动发现。如需立即发现所选配置,请进入 Azure 监视器的基础设施仪表板,单击汉堡 图标,然后单击立即发现

轮询频率

Site24x7 的 Azure Data Explorer 集群监视器每五分钟收集一次分钟级指标数据,并显示 Data Explorer 集群逐分钟的状态。

支持的指标

指标名称描述统计方式单位
批次 Blob 数量 聚合批次中用于摄取的平均数据源数量 平均值 Count
批次持续时间 摄取流程中聚合阶段的持续时间 平均值
已处理批次数 为摄取聚合的批次总数。 总计 Count
批次大小 聚合批次中用于摄取的未压缩预期数据大小 平均值 字节
已丢弃 Blob 数 某组件永久拒绝的 Blob 总数 总计 Count
已处理 Blob 数 某组件处理的 Blob 总数 总计 Count
已接收 Blob 数 某组件从输入流接收的 Blob 总数 总计 Count
缓存利用率 集群范围内的利用率水平 平均值 百分比
缓存利用率系数 当前实例数与最优实例数之间的百分比差(按缓存利用率计算) 平均值 百分比
持续导出最大延迟 集群中持续导出作业报告的延迟(分钟) 最大值 Count
持续导出 - 已导出记录数 导出操作期间每次写入存储项目时触发的已导出记录总数 总计 Count
持续导出待处理数量 等待执行的待处理持续导出作业数量 最大值 Count
持续导出结果 指示持续导出是否成功或失败 Count Count
CPU 平均 CPU 利用率 平均值 百分比
发现延迟 由数据连接报告(如果存在)。从消息添加到队列或事件创建到数据连接发现它的时间。此时间不计入 Azure Data Explorer 总摄取时长 平均值
已丢弃事件数 数据连接永久丢弃的事件总数。将发送一个带有失败原因的摄取结果指标 总计 Count
已处理事件数 集群处理的事件总数 总计 Count
已处理事件数(用于 Event/IoT Hubs) 从 Event/IoT Hub 摄取时集群处理的事件总数 总计 Count
已接收事件数 数据连接接收的事件总数 总计 Count
导出利用率 最大导出利用率 最大值 百分比
摄取延迟 从集群接收数据到数据准备好查询的数据摄取延迟。摄取延迟时间取决于摄取场景 平均值
摄取结果 摄取失败或成功的数据源总数。通过按状态拆分指标,您可以获取摄取操作状态的详细信息 总计 Count
摄取利用率 集群中已使用的摄取槽比率 平均值 百分比
摄取量 摄取到集群的数据总量 总计 字节
实例数 实例总数 平均值 Count
Keep Alive 表示集群是否响应查询的健康检查 平均值 Count
物化视图时效 物化视图的时效(分钟) 平均值 分钟
物化视图数据丢失 物化视图中潜在的数据丢失 最大值 Count
物化视图 Extent 重建数 重建的 Extent 平均数量 平均值 Count
物化视图健康状况 物化视图的健康状况(1 表示健康,0 表示不健康) 平均值 Count
物化视图 Delta 记录数 视图非物化部分中的记录数 平均值 Count
物化视图结果 物化过程的结果 平均值 Count
查询持续时间 查询的持续时间 平均值 毫秒
查询结果 查询总数 Count Count
队列长度 组件队列中待处理的消息数 平均值 Count
队列中最旧消息时间 队列中最旧消息插入以来的时间(秒) 平均值
已接收数据大小(字节) 数据连接期间接收的数据大小。这是数据流的大小,或者原始数据大小(如果提供) 平均值 字节
阶段延迟 从消息被发现到报告组件接收到消息进行处理的累计时间。(发现时间设定为消息被添加到摄取队列时,或被数据连接发现时) 平均值
跟随者延迟 表示该过程的延迟 平均值
流式摄取数据速率 流式摄取数据速率(MB/秒) 平均值 Count
流式摄取持续时间 流式摄取持续时间(毫秒) 平均值 毫秒
流式摄取结果 流式摄取结果 Count Count
并发查询总数 并发查询的总数 最大值 Count
Extent 总数 数据 Extent 的总数 平均值 Count
限速命令总数 限速命令的总数 总计 Count
限速查询总数 限速查询的总数 最大值 Count
弱一致性延迟 上次和下次元数据同步之间的最大延迟(在数据库或节点范围内) 平均值

阈值配置

  • 全局配置
    1. 在左侧导航窗格中单击管理
    2. 从左侧窗格中选择配置文件,然后从下拉菜单中单击阈值和可用性 (+)。在右上角单击添加阈值配置文件
    3. 选择监视器类型为 Azure Data Explorer 集群。现在您可以为上述所有指标设置阈值。
  • 监视器级别配置
    1. 进入云端 > Azure,从下拉菜单中选择 Azure Data Explorer 集群
    2. 选择您想要设置阈值的资源,然后单击汉堡 图标。选择编辑选项,将跳转到编辑 Azure Data Explorer 集群监视器页面。
    3. 您可以通过选择阈值和可用性选项来设置指标的阈值。您还可以在属性级别配置 IT 自动化

IT 自动化

Site24x7 的 IT 自动化工具可帮助自动解决性能下降问题。告警引擎持续评估已设置阈值的系统事件,并在发生超出阈值时执行映射的自动化操作。

如何为监视器配置 IT 自动化

配置规则

使用 Site24x7 的配置规则,为多个监视器配置阈值配置文件、通知配置文件、标签、监视器组等参数。您可以运行扫描并在添加新监视器时关联之前生成的任何适合监视器配置的规则。

如何添加配置规则

摘要

摘要选项卡将按时间显示上述指标的性能数据。

  1. 要查看摘要,进入云端 > Azure,单击 Azure 监视器 > Azure Data Explorer 集群
  2. 单击一个资源,然后单击摘要

这样,您可以查看批次 Blob 数量、批次持续时间、已处理批次数等更多信息。

配置详情

应用程序实例的配置详情在此选项卡下提供。您可以在此处找到状态、数据摄取 URI、启用清除等信息。

  1. 要获取配置详情,进入云端 > Azure,单击 Azure 监视器 > Azure Data Explorer 集群
  2. 单击一个资源,然后选择配置详情选项卡。

报表

通过我们详尽的报表,深入了解受监控资源各项参数的数据,并展示您的服务性能。

查看 Azure Data Explorer 集群报表:

  1. 在左侧导航窗格中导航至报表部分。
  2. 从左侧菜单中选择 Azure Data Explorer 集群

您可以找到针对单个所选监视器的可用性摘要报表和性能报表,也可以获取所有 Azure Data Explorer 集群监视器的资产清单报表、摘要报表、可用性摘要报表、健康趋势报表和性能报表。

您也可以从 Azure Data Explorer 集群监视器的摘要选项卡获取报表。

  1. 进入 Azure Data Explorer 集群监视器的摘要选项卡,通过单击可用性宕机时间获取监视器的可用性摘要报表。
  2. 您也可以通过单击任意图表标题找到监视器的性能报表。

 

相关链接

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!