Site24x7 服务器监控(基于 Agent)
使用我们轻量、易安装的 Agent 监控您的服务器。通过 60 多项性能指标、直观的仪表板、根因分析、IT 自动化和即时告警机制,提前应对中断和性能下降问题。
Agent 架构 - 美国数据中心
了解我们的服务器监控 Agent 如何通过三个数据中心(一个主要数据中心和两个备用数据中心)采集并展示数据。这些数据中心设置在不同位置,以确保在某个数据中心发生故障时监控服务不中断。
- 主数据中心 (PDC) - plus.site24x7.com
- 灾难恢复数据中心 (DRDC) - 主要 (plus2.site24x7.com) 和次要 (plus3.site24x7.com)
如果 PDC 出现错误,状态信息将通过心跳检测自动发送到主要 DRDC,从而避免因间歇性网络故障引发误报告警。如果主要 DRDC 出现错误,次要 DRDC 仍将继续接收心跳检测,以确保监控持续进行。正常情况下的服务器关机信息会由 Agent 明确通知我们的数据中心。
数据采集
Agent 成功安装到用户机器后,将通过单向 HTTPS 连接向 PDC 发起通信。Agent 采集并发送三类数据。
- 心跳检测:每分钟执行一次。如果七分钟内未收到数据,默认发送告警。
- 服务器指标:根据用户设定的间隔采集(1 分钟至 1 天)。每五分钟将数据推送至数据中心。如遇网络故障,数据将存储为 ZIP 文件,在连接恢复后作为积压数据发送。
- 设备消息系统:采集启动或停止进程等操作的实时数据,以及 Agent 升级信息。
心跳检测:
这是 Agent 每分钟向 PDC 执行的状态信息检测。服务器的正常运行时间由 Site24x7 从运行在您服务器上的 Agent 最后收到心跳检测的时间决定。如果 Agent 无法与 PDC 通信,它将尝试联系主要 DRDC,然后是次要 DRDC。
如果心跳检测在连续七分钟内未发生,服务器可用性监视程序将向用户发出告警,提示可能存在网络通信故障或系统崩溃。您也可以在管理 > 服务器监控 > 设置页面自定义此时间间隔,并为设置心跳检测阈值设置合适的值。了解更多。
对于其他数据中心(AU、IN、CN、EU),Agent 将与 PDC 通信,如连接失败则联系主要 DRDC。有关其他数据中心的完整域名列表,请参阅此文档。
轮询间隔为一分钟时的数据采集:
服务器监控 Agent 将每分钟采集一次数据,汇总后每五分钟向 Site24x7 数据中心发送一次。只有在发生阈值违规时,Agent 才会立即与数据中心通信并向用户触发告警。此外,您还可以设置轮询间隔,范围包括 1 分钟、2 分钟、3 分钟、5 分钟、10 分钟、15 分钟、30 分钟、1 小时、3 小时、6 小时、12 小时和 1 天。
网络连接故障期间,数据将以 ZIP 文件形式存储在服务器上。连接恢复后,Agent 将把积压数据发送至 Site24x7 数据中心。因此,即使在通信故障期间也不会丢失数据。
设备消息系统 (DMS):
该系统确保与受监控服务器的实时通信。通过与 DMS 的通信,Agent 可执行用户触发的多种操作,例如启动/停止进程、发现服务/进程、升级 Agent、根因分析以及添加端口、URL、文件、目录和事件日志/系统日志检测。

在报告中断之前,Site24x7 会对其内部网络的可用性状态进行网络健全性检查,以确认是资源本身出现问题,而非其网络故障。请参阅可能的中断场景及排查步骤。
Agent 平均资源消耗
Site24x7 Linux 服务器监控 Agent v19.2.0 在配备 1 核 Intel i7 处理器、4GB 内存和 100GB 磁盘空间的基础 Linux 服务器上进行了资源消耗测试,结果如下:
- CPU 利用率 0.6%
- 内存使用量 200MB(RSS)
- 占用磁盘空间 500MB
- 最大网络带宽消耗 1500 字节/秒
- 每小时向 Site24x7 数据中心发起 120 次调用
同样,Windows 服务器监控 Agent v20.6.0 在配备 1 核 Intel Xeon Platinum 2.6GHz 处理器和 4GB 内存的基础 Windows Server 2019 数据中心版上进行了测试,结果如下:
- CPU 利用率 0.15%
- 内存使用量 150MB(用于监控一个 Windows 应用程序和三个插件)
- 占用磁盘空间 250MB
- 最大网络带宽消耗 1500 字节/秒
- 每小时向 Site24x7 数据中心发起 120 次调用
Agent 生成的日志
Agent 操作日志存储在以下操作系统专属位置:
- Linux:<Installation_Directory>/site24x7/monagent/logs
- Windows:<Installation_Directory>/Site24x7/WinAgent/Monitoring/Logs
了解每个日志文件的描述、最大大小和文件数量,请点击此处。
将 Agent 升级到最新版本
您可以通过 Site24x7 Web 客户端在设置页面自动升级服务器监控 Agent,也可以按照安装步骤手动升级。了解更多关于 Agent 升级过程,请点击此处。
操作系统专属 Agent 详情与操作
Windows
Agent 服务
Agent 运行以下五个服务:
- Site24x7 Agent Helper:管理 Windows Agent
- Site24x7 APP Monitoring Agent:采集应用程序数据
- Site24x7 Applog Agent:采集日志
- Site24x7 Plugin Agent:集成插件
- Site24x7 Windows Agent:主要的 Windows 服务器监控 Agent
支持的操作系统版本
- Windows:7 及以上版本
- Windows Server:2008 及以上版本
Agent 操作
可从系统托盘执行 Agent 操作。打开系统托盘找到 Site24x7 图标,右键点击可执行以下 Agent 操作:
- 查看 Agent 日志
- 执行连接检测
- 访问故障排除提示
- 启动 Agent
- 停止 Agent
- 重启 Agent
- 查看代理配置
- 查看 Agent 详情
- 查看 Agent 状态
- 批量安装服务器监控 Agent
Linux
Agent 进程
Agent 运行以下四个服务:
- Agent Watchdog:管理 Linux Agent
- Applog Agent(可选):启用 AppLogs 后采集日志
- Metrics Agent(可选):启用 StatsD 和 Prometheus 监控时运行
- Linux Agent:主要的 Linux 服务器监控 Agent
支持的 Linux 发行版
| Linux 操作系统发行版 | 支持的版本 |
|---|---|
| Ubuntu | 14.04 及以上(x86_64) 16.04 及以上(Armv8 64bit) |
| Debian | Debian 7 Wheezy、Debian 8 Jessie、Debian 9 Stretch 及以上版本 |
| Red Hat | 6 及以上版本 |
| CentOS | 6 及以上版本 |
| CentOS Stream | 8 及以上版本 |
| Rocky Linux | 8 及以上版本 |
| Oracle Linux | 6.8 及以上版本 |
| AlmaLinux | 8 及以上版本 |
| Amazon Linux | 2 |
| SUSE | SUSE 11 及以上、SLES 12 及以上、open SUSE 15 及以上 |
| Fedora | Fedora 26 及以上(x86_64) Fedora 27 及以上(ARM v8 64bit) |
| OSX | 10 及以上版本 |
| FreeBSD | 9 及以上版本 |
| IBM AIX | 6.1、7.1 和 7.2 *** |
| Oracle Solaris | 10 及以上(x86_64)*** |
| Raspberry Pi | 2023 年 2 月 21 日及以后的版本 |
| Mandriva Linux | 21.1 及以上版本 |
| CoreOS | 37.20230205.3.0 及以上版本 |
| Gentoo Linux | 3.0.31 及以上版本 |
| *** 表示目前显示的指标有限。 | |
Agent 操作
可从终端执行 Agent 操作。运行以下命令执行 Agent 操作,将其替换为所需的 Agent 操作命令参数。
以 root 身份安装的 Agent
- /opt/site24x7/monagent/scripts/AgentManager.sh <option>
以非 root 身份安装的 Agent
- /<installed_directory>/site24x7/monagent/scripts/AgentManager.sh <option>
| 命令参数 | 执行的操作 |
|---|---|
| -ziplogs | 将 Site24x7 Agent 日志打包并存储到 Agent 的临时目录(<installed_directory>/site24x7/monagent/temp/) |
| -newmonitor | 为具有相同 UUID/主机名的服务器创建新监视器 |
| -createmonitor | 为在 Site24x7 中已删除的服务器监视器创建新监视器 |
| -cpu_sar | 启用 SAR 工具以监控 CPU |
| -version | 显示服务器监控 Agent 的版本 |
| -cpu_limit | 设置服务器监控 Agent 可使用的最大 CPU 利用率 |
| -mem_limit | 设置服务器监控 Agent 可占用的最大内存空间 |
| <option> --view | 显示指定选项的报表 |
MySQL 监控专项操作
| 命令参数 | 执行的操作 |
|---|---|
| mysql --add_instance | 添加 MySQL 实例用于监控 |
| mysql --update_instance | 更新 MySQL 实例的凭据 |
| mysql --remove_instance | 从监控中移除 MySQL 实例 |
Agent 安全性
由于 Agent 需要下载并安装在每台需要监控的服务器上,因此了解其安全性、资源使用情况以及成功安装的前提条件非常重要。了解更多。
操作系统与功能
了解更多关于支持的平台、用于在数百台服务器上一次性安装 Agent 的批量部署选项,以及每个平台提供的各种性能指标。
许可提示:每个服务器监视器可以监控哪些内容?
插件集成
监控您的数据库、应用程序、Web 服务器、缓存、消息代理,并追踪最重要的数据。查看我们的100 多个开箱即用插件。如果找不到您希望监控的插件,可以使用 Python 或 Shell 脚本(适用于 Linux)以及 VB、Powershell、Batch 和 DLL(适用于 Windows)编写自定义插件。
