帮助手册 介绍 服务器监控(基于代理)

Site24x7 服务器监控(基于代理)

使用我们轻量级、易于安装的代理监控您的服务器。通过 60 多个性能指标、直观的仪表板、RCA、IT 自动化和即时告警机制,领先于中断和性能下降问题。

代理架构 - 美国数据中心

在 Site24x7 中,两个数据中心——主数据中心(PDC) 和灾难恢复数据中心 (DRDC) 设置在不同的位置,以确保在数据中心发生故障时监控服务不中断。

  • 主数据中心 (PDC) - plus.site24x7.com
  • 灾难恢复数据中心 (DRDC) - 主要 (plus2.site24x7.com) 和辅助 (plus3.site24x7.com)  

如果 PDC 出现任何错误,通过心跳检查的状态信息会自动发送到 Primary DRDC,从而避免由于间歇性网络故障而导致的错误告警。如果 Primary DRDC 发生错误,Secondary DRDC 仍将接收心跳检查以确保继续监控。正常情况下的服务器关闭由代理清楚地传达给我们的数据中心。此外,确保将必要的域、端口和 IP 地址列入白名单 ,以允许在防火墙中进行访问。 

一旦代理成功安装在用户机器中,它与 PDC 的通信将使用单向 HTTPS 连接启动。代理通信通过三种主要方式进行:

心跳检查:

这是代理每分钟对 PDC 进行的状态信息检查。服务器的正常运行时间取决于 Site24x7 从服务器上运行的代理收到心跳检查后的时间。如果代理无法与 PDC 通信,它将尝试联系主要 DRDC,然后联系辅助 DRDC。

如果连续七分钟的时间间隔内没有发生心跳检查,服务器可用性观察器将提醒用户可能的网络通信故障或系统崩溃。您还可以在管理服务器监视器设置页面中自定义此时间间隔,并为设置心跳检查阈值设置适当的值。了解更多

对于其他数据中心(AU、IN、CN、EU),代理将与 PDC 通信,如果连接失败,它将联系主 DRDC。有关其他 DC 中域的完整列表,请参阅本文

轮询间隔为一分钟的数据收集:

服务器监控代理将每分钟收集一次数据,对其进行整合,并每五分钟将其传送到 Site24x7 数据中心。只有在任何违反阈值的情况下,代理才会立即与数据中心通信并向用户触发告警。此外,您还可以在 1 分钟、5 分钟、10 分钟、15 分钟、30 分钟、1 小时、3 小时、6 小时、12 小时和一天的范围内设置轮询间隔。

在网络连接失败期间,数据将作为 Zip 文件存储在服务器中。连接恢复后,代理会将积压数据发送到 Site24x7 数据中心。因此,即使在通信失败期间也不会丢失数据。

设备消息系统 (DMS):

这确保了与监控服务器的实时通信。与 DMS (dms.zoho.com) 的通信每 30 秒发生一次,并且代理执行由用户触发的多个操作,例如启动/停止进程、发现服务/进程、升级代理、根本原因分析、添加端口、 URL、文件、目录和事件日志/系统日志检查。  

Server Monitoring Architecture服务器监控架构

网络健全性检查:

在报告中断之前,Site24x7 通过执行网络健全性检查来检查其内部网络的可用性状态。这是为了确保它是关闭的资源而不是它的网络。查看可能的中断情况和排除故障的步骤

代理安全

由于代理必须下载并安装在需要监控的每台服务器上,因此了解其安全性、资源使用情况以及成功安装的先决条件非常重要。了解更多

操作系统和功能

详细了解支持的平台、可用于一次性在 100 台服务器中安装代理的批量部署选项,以及为每个平台提供的各种性能指标

插件集成

监控您的数据库、应用程序、Web 服务器、缓存、消息代理并跟踪最重要的数据。看看我们的 50 多个开箱即用插件。如果您没有找到您想要监控的,请使用  适用于 Linux 和VB 的Python 和 Shell 脚本、适用于 Windows Powershell、BatchDLL编写您自己的脚本 。 

报表、仪表板和 IT 自动化

接收每次服务器停机的详细根本原因分析报表,一个仪表板中查看您的整个服务器环境,并使用专有的IT 自动化工具自动解决故障。

故障排除提示

安装的任何服务器或应用程序有问题?查看我们的故障排除提示

相关文章

 

帮助手册 介绍 服务器监控(基于代理)