阈值和可用性

阈值是对被监控指标预设的值，超出该值时将触发告警，有助于及时处理性能问题。平台的可用性监控通过对资源可访问性进行持续检查来确保运行状态（正常运行、宕机、告警、严重），并通过您首选的通信方式发送告警通知任何变化。

注意

当用户首次登录 Site24x7 并点击管理 > 库存 > 监视器 > 添加监视器并选择所需服务时，该资源类型的默认阈值和可用性配置文件将自动在阈值和可用性屏幕中列出。

添加阈值和可用性

要添加新的阈值和可用性配置文件：

登录 Site24x7。
点击管理 > 配置文件 > 阈值和可用性。
在阈值和可用性屏幕中点击添加阈值和可用性。
指定以下详情以添加服务的阈值和宕机规则：
- 选择监视器类型：从下拉列表中选择所需的监视器类型。
- 显示名称：提供用于识别的标签。
- 将监视器报告为宕机的位置数：从下拉列表中选择，以便在 Web 服务从指定数量的位置宕机时收到告警通知。
阈值配置
阈值配置将根据您为以下部分提供的值进行设置。根据您选择的监视器类型，将提供这些配置选项的组合。
- 条件：从 <、>、=、<= 或 >= 中选择，设置基于与输入值操作的触发告警标准。
- 阈值：这是您可以为任意性能指标提供的值，例如 CPU 使用率百分比、内存使用量或网络延迟。这些值将与您定义的条件进行比较，以确定是否应触发告警。
- 轮询策略：轮询策略定义 Site24x7 发送请求以收集指标的时间间隔。它因资源类型和监控粒度需求而异。例如，您可能选择更频繁地轮询关键资源，而对不那么关键的资源设置更长的轮询间隔。
- 轮询值：轮询值表示在轮询间隔内从被监控资源收集的最新数据点，即正在被监控的实际测量值。此值用于与您设置的条件进行评估。
- 通知为：定义应发送告警的状态。它允许您自定义希望在资源状态变化时收到通知的时机。例如，根据您提供的值，您可以选择在值超出阈值时立即根据严重程度收到通知。
  
  5.1 基于 Zia 的阈值：
  基于 AI 的阈值将使用异常检测跟踪异常峰值，并提供动态阈值，该阈值将相应更新。如果您选择基于 AI 的阈值，请选择关联的异常严重性和相应状态。
高级阈值

高级阈值允许用户跨不同属性组合多个条件，确保仅在出现有意义的模式或异常时才触发告警。您可以使用逻辑运算符 &&（AND）和 ||（OR），基于单个资源的多个依赖属性（例如服务器的 CPU 和进程指标）发送自定义告警。
使用逻辑运算符可以设置组合多个实时属性的条件。例如，考虑由表达式 A &&(( B && C )|| D) 定义的条件，设置为触发严重告警。在这里，您可以配置：
- A 为 CPU 利用率，将其阈值设置为 > 80%
- B 为内存利用率，将其阈值设置为 >75%
- C 为 磁盘 I/O 等待时间，将其阈值设置为 60 ms
- D 为活动进程数，将其阈值设置为 > 200
在高级阈值配置部分，您可以在单个条件中跨不同阈值条件多次使用同一属性，以实现精确的告警逻辑。例如，您可以组合多个响应时间边界，或将 CPU 和内存阈值配对以反映实际的运营场景。

当同一属性在阈值条件中被引用时，会实时验证条件以确保逻辑保持有意义。

如果条件相互矛盾且无法同时满足，则无法保存配置。例如，配置 response_time_threshold > 90 和 response_time_threshold < 90 会产生逻辑冲突，因为没有任何值能同时满足这两个条件。

系统会识别冗余条件并发出警告，但不会阻止配置。例如，配置 CPU > 90 和 CPU > 80 会使一个条件变得多余，因为更严格的条件已经涵盖了更宽泛的条件。

在设置高级阈值时，可以配置轮询策略、轮询值、通知为和自动化。
注意
- 您可以配置条件来触发三种状态之一：告警、严重或宕机。
- 对于每种状态，只能配置一个条件。要为不同状态添加多个条件，请点击右侧的 + 图标。
- 高级阈值仅适用于监视器级别属性，不适用于子属性。
使用场景
- 负责管理数据中心的 DevOps 团队需要识别资源争用的早期迹象，以防止不必要的扩展。使用高级阈值，他们配置了一个告警，在 CPU 利用率超过 80% 且内存利用率超过 85%，或交换利用率超过 70% 时触发。这有助于在系统保持运行的同时检测早期资源争用。
  条件：((a > 80 && b > 85) || c > 70%)
- 当 Web 应用由于资源消耗高而出现性能下降时，IT 运维团队设置了一个严重告警，在 CPU 利用率超过 85% 且内存利用率超过 90%，或磁盘空间低于 10% 且网络利用率超过 90% 时触发。这会标记需要立即关注的性能问题。
  条件：(a > 85% && b > 90%) || (c < 10% && d> 90%)
- 当数据库服务器接近完全系统故障时，会激活宕机告警。为防止因孤立的峰值产生误报，系统管理员配置了仅在系统处于完全过载状态时才触发的宕机告警。只有当 CPU 利用率 > 90%、内存利用率 > 95% 和交换利用率 > 90% 同时发生时才触发，确保系统真正处于风险中才发出告警。
  条件：(a > 90 && b > 95 && c > 90%)
点击保存。
为服务创建的阈值和可用性配置文件将与其他已创建的配置文件一起自动列在阈值和可用性屏幕中。

注意
具有自定义角色的用户可以使用查看我的资源选项筛选并查看他们创建的资源。