监视器组
监视器组是一个便捷的概念,可帮助您轻松组织受监控的资源并简化管理工作。它允许您按业务应用、地理位置、类型、资源归属等维度对资源(监视器)进行分组。假设您有一个 Web 应用,其服务托管于特定的数据库、应用服务器和物理服务器上。通过"监视器组"的概念,您可以快速将所有这些资源聚合在一个层级下,从而便于统一报表生成,并帮助了解中断期间各资源及整个组的实时与历史运营趋势。此外,您还可以在主监视器组下添加最多五层嵌套的子组,并通过业务视图可视化所有监控资源。业务视图在此场景下清晰呈现了"业务应用的状态"。
添加监视器组
监视器组和子组可帮助您无缝组织受监控的资源并简化管理工作。一旦配置了监视器组,系统会自动生成相应的业务视图,提供该组及其多个子组之间各种连接和依赖关系的可视化表示。监视器组的创建方式包括:
- 系统在深度发现互联网资源监视器后自动生成组
- 使用默认模板创建业务视图框架
- 手动配置
系统自动生成的组
互联网服务深度发现功能可帮助您智能发现托管域名背后的所有互联网资源。在深度发现过程中,Site24x7 会借助直观的向导自动发现并建议该特定域名/子域名下所有可能的互联网服务监视器。一旦这些监视器完成配置,Site24x7 将自动为这些监视器创建一个监视器组。您可以通过添加子组并关联相关监视器来进一步自定义。
使用默认模板
配置监视器组最简单的方法是使用 Site24x7 提供的默认模板。您可以选择 Site24x7 提供的预定义业务视图模板,创建包含相关子组的监视器组。空监视器组创建完成后,您可以立即为各个组和子组关联更多监视器,在短时间内查看个性化的资源业务视图。可用模板包括:
- 网站/端口/DNS
- 应用服务器
- AWS 基础设施
- 网络
- 网站/服务器
- 登录 Site24x7 客户端。
- 导航至首页 > 监视器组 > 使用模板创建组。
- 系统将显示一个仪表板视图,列出多个可用模板。点击其中一个模板即可立即构建相应的监视器组。
注意监视器组及其关联的子组默认情况下不会关联任何监视器。您可以稍后为各组和子组关联多个监视器。

手动配置
此外,您也可以通过在添加监视器组表单中填写相关参数来手动配置监视器组。请按照以下步骤构建您的监视器组:
- 登录 Site24x7 客户端。
- 点击管理 > 库存 > 监视器组。
- 点击(+)图标,或在监视器组页面右上角的下拉菜单中选择创建组,以设置您的监视器组。
- 在添加监视器组页面中填写以下详细信息,完成监视器组的设置:
- 显示名称:为监视器组指定一个便于识别的名称。
- 描述:为该组提供说明。
- 组类型:从所有类型/Web/服务器/数据库中选择一种组类型,以按类型对现有监控资源进行细分。选择组类型后,您可以通过添加或移除监视器来自定义监视器组。选择"所有类型"可将所有监视器关联到该组,不限类型。
注意各组类型下的监控资源:
Web 组:
网站、DNS 监视器、域名到期监视器、SSL 证书监视器、真实浏览器监视器、网页分析器、REST API 监视器、SOAP 监视器、Web 应用监视器、网站篡改监视器、端口(自定义协议)、POP 服务器、SMTP 服务器、FTP 服务器、APM Insight 监视器、真实用户监视器,以及 Android 和 iOS 的移动端 APM。
服务器组:
服务器监视器、VCenter 监视器、VCenter 集群监视器、MS Exchange 监视器、Microsoft Active Directory、Microsoft IIS 服务器、Microsoft Hyper-V 服务器、Microsoft SharePoint 服务器、Microsoft BizTalk 服务器、Microsoft Office 365、Windows 集群、插件、探针、经典负载均衡器、应用负载均衡器、Docker 监视器
数据库组:
SQL Server、RDS 实例、DynamoDB
- 选择监视器:从现有监视器资源池中关联多个监视器,自定义您的监视器组。选择要包含的监视器类型,然后从列表中选择具体监视器。您可以选择所有资源、手动从列表中选取相关监视器,也可以选择不为该组关联任何监视器。但您必须至少关联一个监视器,以便确定组的整体状态。
- 用于确定监视器组状态的监视器数量阈值:输入首选的监视器数量阈值,以确定监视器组的状态。
注意- Site24x7 根据用户配置的预设监视器数量阈值来确定监视器组的状态。了解详情。
- 如果您将监视器数量阈值设置为"0",Site24x7 将把监视器组中的所有监视器纳入考量以确定组的状态。默认阈值始终为"1"。

- 包含相关监视器:选择此选项可包含上述已选监视器的所有关联监视器。例如,当您从"选择监视器"列表中选择一个服务器监视器时,该服务器监视器的所有关联监视器(如 SQLServer、WindowsCluster、插件和数据库洞察)也将被添加到监视器组中。
- 添加子组:您可以输入以逗号分隔的名称,批量创建空子组以完成监视器组的创建。空子组创建后,您可以访问该子组并为其关联更多监视器。
- 健康检查配置:健康检查功能可监控和跟踪监视器组及子组的整体健康状况和可用性。从下拉列表中选择所需的健康检查配置文件。点击健康检查配置文件字段旁的添加图标 +,可为健康检查添加阈值配置文件。
注意如需编辑阈值配置文件,请点击健康检查配置文件字段旁的铅笔图标
。 - 配置文件:选择或添加标签,以创意方式组织和管理监视器。您可以通过分配简单的名称-值对和颜色来创建唯一标签。要添加标签,请点击添加标签,在添加标签对话框中输入标签名称、标签值并选择标签颜色,然后点击保存。
- 告警设置
- 第三方集成:此部分显示该监视器组可用的活跃第三方服务。要将监视器告警推送至您偏好的第三方服务,请前往管理 > 第三方集成并接入所需的第三方服务。
- 依赖配置:
自动配置(仅限 AWS 资源)
AWS 用户可以利用我们的自定义标签 group_site24x7 将资源自动汇总到监视器组中。您只需打开受支持云服务的 AWS 管理控制台,为目标资源分配键为 group_site24x7(区分大小写)的标签,并设置您所需的值即可。例如,如果您有多个各自执行特定功能(Web 服务器、消息代理、数据库)的资源集群,您可以为每个集群自动创建独立的监视器组,以可视化方式监控所有支撑您部署的计算实例的运行状况。
以下是为 AutoScaling 组添加标签的步骤:
- 登录 Amazon Elastic Compute Cloud (EC2) 控制台。
- 在左侧导航栏中,找到 Auto Scaling 下的 Auto Scaling 组,选择您的 Auto Scaling 组。
- 点击 标签选项卡,然后选择 添加/编辑标签(该页面列出了 AutoScaling 组的所有现有标签)。
- 选择 添加标签,输入键:group_site24x7,以及您所需的值(例如 production_infra)。
- 保持 标记新实例复选框处于选中状态,以将标签应用于所有新启动的实例(这确保 Site24x7 监视器组始终保持最新状态)。
- 选择 保存。

监视器组创建
完成上述操作后,Site24x7 将在下一次轮询时自动创建名为 production_infra 的新监视器组,并将所有 EC2 实例汇总到该组中。
始终保持同步
您分配的标签会在每次轮询(每 5 分钟)时与 Site24x7 同步。这确保所创建的监视器组始终保持最新状态。
查看监视器组:卡片视图与列表视图
您可以选择以可视卡片或列表格式查看监视器组。监视器组及其子组均支持卡片视图和列表视图。
您可以在"监视器组"页面右上角选择所需的视图。所选视图将同时应用于监视器组及其子组。这种灵活性使您可以选择最适合自己监控需求和工作方式的布局。
卡片视图
卡片视图将被弃用,不再接受进一步更新。列表视图现已成为默认体验。
每个组以独立卡片形式显示。该视图可帮助您快速评估每个组的健康状况,适合组数较少或偏好可视化概览的环境。

列表视图
您可以切换到列表视图,以更紧凑的表格布局查看监视器组。该视图以嵌套结构显示监视器组名称和子组,帮助您在不失去层级上下文的情况下进行管理。您可以展开监视器组和子组,在单页上查看所有关联的监视器,无需逐个打开每个监视器组或子组,从而获得对监控配置的统一视图。
在此视图中,您可以检查监视器可用性、查看监视器名称、监视器类型和当前状态等关键详情,并直接管理监视器而无需离开当前页面。这对于包含多个嵌套监视器组和子组的大型环境尤为实用。
点击搜索栏,可按名称搜索特定监视器并在展开的列表中快速定位。您可以使用状态下拉菜单,按当前状态筛选监视器,例如宕机、正常、严重、警告、已暂停或维护中,从而快速聚焦于特定状态的监视器。您还可以按监视器类型搜索列表,仅查看所需资源。此外,您可以使用每个监视器旁的汉堡图标执行监视器管理操作,如编辑、添加到监视器组、激活和删除。

搜索和筛选选项
页面顶部的搜索栏可用于定位特定的监视器组或子组。
- 按父监视器组名称搜索:输入父监视器组的完整名称,可查看该组及其所有关联子组,显示该组的完整层级结构。
- 按子组名称搜索:输入特定子组的完整名称,可查看该子组及其所属的监视器组,同一监视器组的其他子组或层级不会显示。
搜索结果不会自动提示。您需要输入监视器组或子组的确切名称才能获得结果。
在搜索栏旁边,您可以使用状态筛选器缩小结果范围。可用的状态选项包括正常、宕机、严重和警告。
选择状态筛选器后,将仅显示与所选状态匹配的监视器组或子组,有助于聚焦于问题区域或验证特定状态下的组。
容量规划
监视器组的容量规划提供一组监视器的分析数据,用于确定特定操作或工作负载所需的资源容量。您可以在监视器组下创建容量规划监视器,并跟踪容量规划监视器下各资源的健康和性能状态。
健康检查
健康检查功能可监控和跟踪监视器组及子组的整体健康状况和可用性。设想您有一组服务器、数据库和服务协同运行一个关键应用。单独监控每个组件并汇总其可用性数据是非常繁琐的,健康检查功能正是为此而生。它可帮助您查看、分析和管理监视器组的状态及可用性。
创建监视器组或子组时,健康检查会自动启用。因此,您可以立即查看监视器组的整体健康状况和状态,并在单个资源发生中断时收到通知。
每当资源发生状态变更时,您将收到详细的根因分析报告,并可在监视器组层面识别影响范围。此外,资源状态变更会即时传播至监视器组,并在监视器组层面生成综合告警,有效降低告警噪音。
自定义依赖配置
当 IT 基础设施发生灾难性故障时,由于冗余告警的产生,您很可能会迅速耗尽所有通知额度。Site24x7 内置了误报防护机制,允许您在监视器组中配置依赖监视器,以应对此类最坏情况。您需要在监视器组中设置一个依赖资源,该资源将根据自身的宕机状态来控制和抑制发送给其他资源的告警。按照以下步骤激活其他资源的告警抑制,从而保护您的告警额度免遭意外消耗。了解更多关于告警抑制的内容。
- 从下拉菜单中选择一个依赖资源。最多可选择 20 个监视器作为依赖资源。
注意
- 您可以根据资源的智能分组选择依赖资源。如果您的监视器组中有一组应用服务器监视器(URL 监视器、SSL 等)和一个防火墙监视器(Ping 监视器/端口监视器),您可以通过将这些监视器与防火墙监视器的宕机状态关联,来控制应用服务器监视器的告警功能,从而为您的账户启用误报防护。最多可添加 20 个监视器作为依赖资源。
- 依赖资源的检查频率将被调整为最小值,以确保"正常"状态与"宕机"状态之间的检查间隔明显短于任何依赖它的资源。
- 勾选"当依赖监视器宕机时抑制告警"复选框,以激活针对其他资源的告警抑制。
注意- 在轮询期间,如果监视器组中的某个资源被检测为宕机,Site24x7 会在向您发送该监视器状态通知之前,自动检查并核实依赖监视器的状态。
如果监视器组中的某个资源被检测为宕机,同时依赖监视器被检测为:- 宕机:Site24x7 将抑制发送给该资源的告警。
- 正常:Site24x7 将识别该资源为宕机并触发告警。
- 轮询进行中:Site24x7 将等待依赖资源的状态确定后,再决定是否为该资源触发告警。
- 维护中:Site24x7 不会为相关资源触发任何告警。
- 当某个监视器的告警因其在监视器组中的依赖配置而被抑制时,相关记录将被记录在告警日志中。
- 启用此设置后,所有告警渠道(包括 SMS、语音、IM、移动推送通知和 Web 浏览器推送通知)均将被抑制。
- 在轮询期间,如果监视器组中的某个资源被检测为宕机,Site24x7 会在向您发送该监视器状态通知之前,自动检查并核实依赖监视器的状态。
- 点击保存。
创建/修改子组
Site24x7 允许您按需创建多个监视器组和子组,以自定义 IT 基础设施的分组方式,便于监控基础设施的管理。在父监视器组下创建的任何监视器子组,均可从首页 > 监视器组或管理库存选项卡中的监视器组列表视图(嵌套视图)中查看。您必须点击显示子组按钮才能在监视器组仪表板中启用此功能。父监视器组下的所有监视器,以及子组中关联的所有监视器,也将显示在首页选项卡的监视器组摘要屏幕中的监视器列表下。您可以随时编辑或删除现有的监视器子组。子组仅作为设置业务视图的一部分而创建,不用于告警抑制或状态传播。
如何创建子组?
您可以通过以下任一方式创建子组:
- 访问首页 > 监视器组 > 监视器组详情仪表板 > 选择您偏好的监视器组。
- 点击监视器组详情仪表板顶部显示的
图标,从下拉菜单中选择"子组"。添加子组窗口打开后,您即可开始添加/编辑/删除子组。
注意添加子组选项仅适用于父监视器组。

- 另一种方式是访问业务视图仪表板。在父监视器组内双击鼠标可添加子组/编辑组;在子组内双击鼠标可创建另一个嵌套子组,或编辑/删除该子组。
- 点击添加子组按钮可创建新子组。点击"X"图标可立即删除子组。
- 为子组指定名称和描述。
- 子组类型:从所有类型/Web/服务器/数据库中选择一种子组类型,以按类型对现有监控资源进行细分。选择组类型后,您可以通过关联或移除监视器来自定义子组。选择"所有类型"可将所有监视器关联到该子组,不限类型。
- 选择监视器:从现有监视器资源池中关联多个监视器,自定义您的子组。选择要包含的监视器类型,然后从列表中选择具体监视器。您可以选择所有资源、手动从列表中选取相关监视器,也可以选择不为该组关联任何监视器。但您必须至少关联一个监视器,以便确定子组的整体状态。
- 用于确定组状态的监视器数量阈值:输入首选的监视器数量阈值,以确定子组的状态。了解 Site24x7 如何确定组的状态。

- 在业务视图仪表板中,点击右上角显示的修改业务视图图例。这将允许您添加/编辑/删除子组,并同步修改业务视图。
注意您无法从管理 > 库存 > 监视器组页面创建子组。但您可以通过选择显示子组按钮,以嵌套视图查看监视器组的所有关联子组。
创建监视器子组的规则与限制:
- 每个监视器组最多可有五层子组链(A1 至 A5)。
- 父监视器组下可添加的子组数量没有限制(A2 至 n2)。
- 一个监视器组只能有一棵以自身为父组的树(只能有一棵以 A1 为父节点的树)。
- 任何特定子组在每棵树中只能出现一次。一旦某个子组已关联到某个监视器组,就不能再将其关联到第二个监视器组(B3 在您账户中的任何监视器组下只能作为子组出现一次)。

子组的报表和维护
管理用户
超级管理员或管理员可以管理与监视器组关联的用户的访问权限,操作方法如下:
- 导航至您偏好的监视器组。
- 点击汉堡图标 > 选择管理用户访问权限。
- 在弹出的管理此监视器组的用户访问权限窗口中,点击添加用户,并选择您偏好的用户。
- 完成后点击保存。
取消选择某个用户后,该用户对该组的访问权限将被撤销。
具有组级权限的管理员只能为其有访问权限的组管理(关联和解除关联)其自己创建的用户。

下拉菜单中仅列出被允许访问监视器组的用户。
组筛选
以下用户表单/仪表板支持按监视器组进行筛选。在所有这些场景中,仅列出父监视器组。但是,一旦选择了某个父监视器组,该父组的子组中关联的监视器也将被自动纳入考量并添加到列表中。
- 用户与告警表单
- 计划维护表单
- 计划报表表单
- 状态页面表单
- 运维仪表板表单
- 公开报表
监视器组中的 NOC 视图
首页上的 NOC 视图选项允许您查看所有监视器,而监视器组页面上的 NOC 视图选项仅显示该特定监视器组的监视器。

中断
中断选项卡提供所选监视器组中断事件的统一视图,帮助您跟踪所有关联监视器的宕机事件,并分析选定时间段内的中断持续时间、根本原因和影响。
中断选项卡显示每个中断事件的以下详细信息:
- 监视器名称:发生中断的监视器。
- 开始时间:中断开始的确切时间。
- 结束时间:监视器从中断中恢复的时间。
- 持续时间:中断的总持续时间。
- 原因:与中断相关的原因或根本原因。
- 最新评论:显示最新的中断相关评论或更新(如有)。
您可以使用右上角的时间段下拉菜单,筛选特定时间段内的中断数据,例如过去 24 小时、过去 7 天或自定义时间范围。如果在所选时间段内未检测到中断,页面将显示相应提示,说明该时间段内未记录中断事件。
共享中断报表
点击共享为选项,可以不同格式导出或共享中断数据。可用选项如下:
- CSV:以 CSV 格式导出中断详情,用于进一步分析或报告。
- PDF:将中断报表下载为 PDF 文档。
- 电子邮件:通过电子邮件发送中断报表。
- 共享至:将中断数据直接发送至受支持的第三方工具。
仅当所选工具已配置受支持的第三方集成时,共享至选项才可用。
使用共享至选项时,您可以配置以下内容:
- 第三方工具:选择中断报表应发送至的第三方工具。
- 消息标题:系统提供默认消息标题,您可以修改它以自定义共享消息中通知标题的显示方式。

建议
建议创建一个专用的集成渠道来发送报表,而非使用与告警相同的渠道。使用专用渠道有助于保持清晰,确保报表不会被忽视或与告警通知混淆。
业务视图
监视器组中的监视器子组分组功能提供了一种简单直观的方式来组织资源并简化管理。它帮助您以鸟瞰视角快速发现监视器中的异常模式。Site24x7 监视器组业务视图选项卡可在首页选项卡的监视器组详情视图屏幕中访问。业务视图可帮助您快速发现监视器组及关联子组中的异常值和异常监控模式,这些可操作的洞察可用于制定最佳的基础设施管理决策。通过在父监视器组下设置多个监视器子组,您可以以前所未有的方式可视化 IT 基础设施。
业务视图允许您轻松筛选各个监视器、监视器组和子组的可用性详情。它内置了折叠/展开组工具
和放大检查器。该工具可用于折叠或展开监视器子组。在此视图中,每当某个监视器子组处于宕机状态时,其圆圈将间歇性地闪烁红色以引起您的注意。父监视器组始终不会折叠。同样,放大检查器工具可用于放大
和缩小
各个监视器子组,以获取监视器组中每个监视器的准确状态。监视器组/子组中的每个监视器以圆圈表示,每个圆圈按颜色编码展示当前监视器状态:红色圆圈表示宕机,橙色圆圈表示严重,黄色圆圈表示警告,绿色圆圈表示正常。只需将鼠标悬停在圆圈上,即可获取每个子组中活跃监视器数量和各监视器状态的详细信息。在业务视图中,各子组以圆圈渲染,每个圆圈外边界的颜色表示该组的状态。如需设置默认业务视图,只需点击刷新按钮。在默认视图中,您可以在一屏中查看展开的圆圈及所有监视器圆圈。
如果您希望查看特定监视器中断的性能统计数据或根本原因,也可以实现。只需点击标识该监视器的相关圆圈即可。对于状态为正常、严重或警告的监视器,点击鼠标后将呈现性能统计报表。对于宕机的监视器,如果有可用的根因分析报告,则会生成该报告。
正常、严重或警告监视器的性能统计报表突出显示基本监视器详情,以及中断持续时间、全局状态和性能图表。
宕机监视器的根因分析将突出显示基本监视器详情、宕机原因和持续时间,以及基于所选监视器类型的监视器重新检查报告或路由跟踪详情。

事件时间轴小部件
事件时间轴记录业务视图中监视器在所选时间范围内的所有历史事件。您可以识别/解码各类历史事件,包括宕机、严重、警告、维护、已暂停或异常。每种事件均按颜色编码,便于识别。可以深入钻取事件以提取最大数据量,便于故障排除。您还可以追踪特定时间块内的实际中断时段和总中断持续时间,粒度最高可达 1 毫秒。

您也可以通过添加或更新监视器组和子组来修改业务组。使用
来修改业务视图。或者,在监视器组/子组内部双击以添加/编辑/删除相应内容。

查看监视器组控制面板
监视器组帮助您按业务应用、地理位置、类型或资源归属对资源(监视器)进行组织,是资源管理的便捷概念。您可以从单一控制面板轻松访问所有监视器组,无需过多导航。它还通过颜色状态码标识每个监视器组的状态:宕机的监视器以红色分组;橙色标识严重状态的监视器;黄色标识警告状态的监视器;维护中的监视器以紫色分组;可用的监视器以绿色显示;已暂停的监视器以灰色显示。
选择相关监视器组后,您可以进一步了解该监视器组在所选时间段内的可用性和性能等指标。摘要控制面板通过以下小部件提供具体详情:事件时间轴(提供各类中断和异常事件的信息,包括中断持续时间和精确中断时段)、监视器列表(父监视器组下的所有监视器将显示在监视器列表中)及其状态。中断控制面板通过帮助您深入各资源,追踪组内所有单个监视器的性能响应时间(毫秒)和中断持续时间,提供各监视器宕机情况的可见性。您可以使用业务视图来获取监视器在监视器组内组织方式及其个别性能的高层级概览。异常选项卡以表格形式追踪并呈现指定范围内的所有性能偏差。您可以使用放大检查器在特定时间范围内导航,以追踪性能变化。

许可
监视器组的许可限制以及每个组内监视器的数量限制因您的订阅计划而异。以下是监视器组许可限制的说明。
主要许可限制
- 父组和子组均计入监视器组限制。
- 默认监视器组限制(企业套餐以外的所有套餐):
- 最多 500 个监视器组
- 企业套餐限制:
- 最多 1,500 个监视器组(500 × 3)
企业套餐分配
企业用户可根据活跃监视器数量获得额外配额:
- 计算公式:1,500 + (活跃监视器总数的 10%)
示例:
如果您有 50,000 个活跃监视器:
- 50,000 的 10% = 5,000
因此,允许的监视器组总数为 1,500 + 5,000 = 6,500
此总数包括用户生成的和系统生成的监视器组。
每组监视器数量
每个监视器组可包含:
- 最多 5,000 个监视器(所有计划的默认限制)
