帮助手册

Site24x7 服务器监控(基于 Agent)

使用我们轻量、易安装的 Agent 监控您的服务器。通过 60 多项性能指标、直观的仪表板、根因分析、IT 自动化和即时告警机制,提前应对中断和性能下降问题。

Agent 架构 - 美国数据中心

了解我们的服务器监控 Agent 如何通过三个数据中心(一个主要数据中心和两个备用数据中心)采集并展示数据。这些数据中心设置在不同位置,以确保在某个数据中心发生故障时监控服务不中断。

  • 主数据中心 (PDC) - plus.site24x7.com
  • 灾难恢复数据中心 (DRDC) - 主要 (plus2.site24x7.com) 和次要 (plus3.site24x7.com)  

如果 PDC 出现错误,状态信息将通过心跳检测自动发送到主要 DRDC,从而避免因间歇性网络故障引发误报告警。如果主要 DRDC 出现错误,次要 DRDC 仍将继续接收心跳检测,以确保监控持续进行。正常情况下的服务器关机信息会由 Agent 明确通知我们的数据中心。

为与我们的数据中心建立连接,Agent 使用专用的IP 域名和端口。建议您将其添加到允许列表中,以确保监控顺畅运行。

数据采集

Agent 成功安装到用户机器后,将通过单向 HTTPS 连接向 PDC 发起通信。Agent 采集并发送三类数据。

  • 心跳检测:每分钟执行一次。如果七分钟内未收到数据,默认发送告警。
  • 服务器指标:根据用户设定的间隔采集(1 分钟至 1 天)。每五分钟将数据推送至数据中心。如遇网络故障,数据将存储为 ZIP 文件,在连接恢复后作为积压数据发送。
  • 设备消息系统:采集启动或停止进程等操作的实时数据,以及 Agent 升级信息。

心跳检测:

这是 Agent 每分钟向 PDC 执行的状态信息检测。服务器的正常运行时间由 Site24x7 从运行在您服务器上的 Agent 最后收到心跳检测的时间决定。如果 Agent 无法与 PDC 通信,它将尝试联系主要 DRDC,然后是次要 DRDC。

如果心跳检测在连续七分钟内未发生,服务器可用性监视程序将向用户发出告警,提示可能存在网络通信故障或系统崩溃。您也可以在管理 > 服务器监控 > 设置页面自定义此时间间隔,并为设置心跳检测阈值设置合适的值。了解更多

注意

对于其他数据中心(AU、IN、CN、EU),Agent 将与 PDC 通信,如连接失败则联系主要 DRDC。有关其他数据中心的完整域名列表,请参阅此文档

轮询间隔为一分钟时的数据采集:

服务器监控 Agent 将每分钟采集一次数据,汇总后每五分钟向 Site24x7 数据中心发送一次。只有在发生阈值违规时,Agent 才会立即与数据中心通信并向用户触发告警。此外,您还可以设置轮询间隔,范围包括 1 分钟、2 分钟、3 分钟、5 分钟、10 分钟、15 分钟、30 分钟、1 小时、3 小时、6 小时、12 小时和 1 天。

网络连接故障期间,数据将以 ZIP 文件形式存储在服务器上。连接恢复后,Agent 将把积压数据发送至 Site24x7 数据中心。因此,即使在通信故障期间也不会丢失数据。

设备消息系统 (DMS)

该系统确保与受监控服务器的实时通信。通过与 DMS 的通信,Agent 可执行用户触发的多种操作,例如启动/停止进程、发现服务/进程、升级 Agent、根因分析以及添加端口、URL、文件、目录和事件日志/系统日志检测。 

服务器监控架构

网络健全性检查:

在报告中断之前,Site24x7 会对其内部网络的可用性状态进行网络健全性检查,以确认是资源本身出现问题,而非其网络故障。请参阅可能的中断场景及排查步骤

Agent 平均资源消耗

Site24x7 Linux 服务器监控 Agent v19.2.0 在配备 1 核 Intel i7 处理器、4GB 内存和 100GB 磁盘空间的基础 Linux 服务器上进行了资源消耗测试,结果如下:

  • CPU 利用率 0.6%
  • 内存使用量 200MB(RSS)
  • 占用磁盘空间 500MB
  • 最大网络带宽消耗 1500 字节/秒
  • 每小时向 Site24x7 数据中心发起 120 次调用

同样,Windows 服务器监控 Agent v20.6.0 在配备 1 核 Intel Xeon Platinum 2.6GHz 处理器和 4GB 内存的基础 Windows Server 2019 数据中心版上进行了测试,结果如下:

  • CPU 利用率 0.15%
  • 内存使用量 150MB(用于监控一个 Windows 应用程序和三个插件)
  • 占用磁盘空间 250MB
  • 最大网络带宽消耗 1500 字节/秒
  • 每小时向 Site24x7 数据中心发起 120 次调用
注意

上述结果是在 Agent 不运行额外插件、日志管理(AppLogs)服务或应用程序的情况下获得的。配置或环境的变化可能影响资源消耗。

Agent 生成的日志

Agent 操作日志存储在以下操作系统专属位置:

  • Linux:<Installation_Directory>/site24x7/monagent/logs
  • Windows:<Installation_Directory>/Site24x7/WinAgent/Monitoring/Logs

了解每个日志文件的描述、最大大小和文件数量,请点击此处

将 Agent 升级到最新版本

您可以通过 Site24x7 Web 客户端在设置页面自动升级服务器监控 Agent,也可以按照安装步骤手动升级。了解更多关于 Agent 升级过程,请点击此处

操作系统专属 Agent 详情与操作

Windows | Linux

Windows

Agent 服务

Agent 运行以下五个服务:

  • Site24x7 Agent Helper:管理 Windows Agent
  • Site24x7 APP Monitoring Agent:采集应用程序数据
  • Site24x7 Applog Agent:采集日志
  • Site24x7 Plugin Agent:集成插件
  • Site24x7 Windows Agent:主要的 Windows 服务器监控 Agent

支持的操作系统版本

  • Windows:7 及以上版本
  • Windows Server:2008 及以上版本
注意

旧版本可能存在兼容性,但由于 Microsoft 已停止对过期 Windows 版本的支持,不建议使用旧版 Windows。

Agent 操作

可从系统托盘执行 Agent 操作。打开系统托盘找到 Site24x7 图标,右键点击可执行以下 Agent 操作:

  • 查看 Agent 日志
  • 执行连接检测
  • 访问故障排除提示
  • 启动 Agent
  • 停止 Agent
  • 重启 Agent
  • 查看代理配置
  • 查看 Agent 详情
  • 查看 Agent 状态
  • 批量安装服务器监控 Agent

Linux

Agent 进程

Agent 运行以下四个服务:

  • Agent Watchdog:管理 Linux Agent
  • Applog Agent(可选):启用 AppLogs 后采集日志
  • Metrics Agent(可选):启用 StatsD 和 Prometheus 监控时运行
  • Linux Agent:主要的 Linux 服务器监控 Agent

支持的 Linux 发行版

Linux 操作系统发行版 支持的版本
Ubuntu 14.04 及以上(x86_64)
16.04 及以上(Armv8 64bit)
Debian Debian 7 Wheezy、Debian 8 Jessie、Debian 9 Stretch 及以上版本
Red Hat 6 及以上版本
CentOS 6 及以上版本
CentOS Stream 8 及以上版本
Rocky Linux 8 及以上版本
Oracle Linux 6.8 及以上版本
AlmaLinux 8 及以上版本
Amazon Linux 2
SUSE SUSE 11 及以上、SLES 12 及以上、open SUSE 15 及以上
Fedora Fedora 26 及以上(x86_64)
Fedora 27 及以上(ARM v8 64bit)
OSX 10 及以上版本
FreeBSD 9 及以上版本
IBM AIX 6.1、7.1 和 7.2 ***
Oracle Solaris 10 及以上(x86_64)***
Raspberry Pi 2023 年 2 月 21 日及以后的版本
Mandriva Linux 21.1 及以上版本
CoreOS 37.20230205.3.0 及以上版本
Gentoo Linux 3.0.31 及以上版本
*** 表示目前显示的指标有限。
注意

此列表并不完整;如需了解与其他 Linux 发行版的兼容性,请联系 Site24x7。

Agent 操作

可从终端执行 Agent 操作。运行以下命令执行 Agent 操作,将其替换为所需的 Agent 操作命令参数。

以 root 身份安装的 Agent

  • /opt/site24x7/monagent/scripts/AgentManager.sh <option>

以非 root 身份安装的 Agent

  • /<installed_directory>/site24x7/monagent/scripts/AgentManager.sh <option>
命令参数 执行的操作
-ziplogs 将 Site24x7 Agent 日志打包并存储到 Agent 的临时目录(<installed_directory>/site24x7/monagent/temp/)
-newmonitor 为具有相同 UUID/主机名的服务器创建新监视器
-createmonitor 为在 Site24x7 中已删除的服务器监视器创建新监视器
-cpu_sar 启用 SAR 工具以监控 CPU
-version 显示服务器监控 Agent 的版本
-cpu_limit 设置服务器监控 Agent 可使用的最大 CPU 利用率
-mem_limit 设置服务器监控 Agent 可占用的最大内存空间
<option> --view 显示指定选项的报表

MySQL 监控专项操作

命令参数 执行的操作
mysql --add_instance 添加 MySQL 实例用于监控
mysql --update_instance 更新 MySQL 实例的凭据
mysql --remove_instance 从监控中移除 MySQL 实例

Agent 安全性

由于 Agent 需要下载并安装在每台需要监控的服务器上,因此了解其安全性、资源使用情况以及成功安装的前提条件非常重要。了解更多

操作系统与功能

了解更多关于支持的平台、用于在数百台服务器上一次性安装 Agent 的批量部署选项,以及每个平台提供的各种性能指标

插件集成

监控您的数据库、应用程序、Web 服务器、缓存、消息代理,并追踪最重要的数据。查看我们的100 多个开箱即用插件。如果找不到您希望监控的插件,可以使用 Python 或 Shell 脚本(适用于 Linux)以及 VB、Powershell、BatchDLL(适用于 Windows)编写自定义插件。

报表、仪表板与 IT 自动化

获取每次服务器宕机的详细根因分析报表,在统一仪表板中查看整个服务器环境,并使用专属的 IT 自动化工具实现故障自动修复。

故障排除提示

服务器或应用程序遇到问题?请查阅我们的故障排除提示

后续步骤

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!