帮助手册

Linux 服务器监控性能指标

通过统一仪表板监控和衡量 Linux 服务器的 CPU、内存、磁盘利用率、进程和网络流量等关键指标。成功安装 Linux 代理后,登录 Site24x7 网页客户端并导航至服务器 > 服务器监控 > 服务器 > 点击新添加的监视器,即可查看其性能指标。

Linux 代理将数据发送至相应的 Site24x7 数据中心。由于代理需要下载并安装在您的服务器上,请了解更多关于代理安全性的信息。 

摘要

在单一控制台中获得 Linux 服务器性能所有重要参数的可见性。热力图分析为您提供服务器过去七天状态和性能的快速摘要。 

点击图标  可查看包含 CPU、内存、磁盘利用率等指标的性能报表。您也可以从页面右上角的下拉菜单中选择适当的时间段,查看特定时间段的性能数据,并可将性能详情导出为 CSV/PDF 格式或通过邮件发送。

平均负载

平均负载是一段时间内的系统平均负荷。平均负载数据可帮助您了解物理 CPU 是否过载或负载不足。如出现过载情况,您可以检查是否有进程浪费资源、提供更多硬件资源,或将部分工作负载迁移至其他系统。

CPU 利用率

定期监控 CPU 使用情况对于分析一段时间内的 CPU 负载、克服性能回退至关重要。

然而,并非所有高 CPU 使用率都是严重问题。基于时间段查看报表的功能有助于识别真正有问题的 CPU 使用情况,从而帮助您追溯导致 CPU 飙升的实际原因。根据分析结果,您可以采取升级 CPU 硬件、增加 CPU 数量,或关闭占用这些关键资源的无谓服务等解决方案。

CPU 利用率使用 'top' 命令计算。了解更多

CPU 利用率 = 100 - 空闲时间

您还可以将鼠标悬停在 CPU 利用率图表中的某个点上,查看该时间点 CPU 占用最高的五个进程。 进程排名数据使用 Python 模块 'psutil' 计算。

点击标题旁的  图标,可访问 CPU 使用情况的性能报表。报表包含:

  • 按核心划分的 CPU 利用率
  • 中断次数——处理器接收的硬件中断平均次数。
  • 上下文切换——从一个线程切换到另一个线程的速率。线程切换可在单个进程内或跨进程发生。
  • CPU 指标——用户空间时间、硬件中断时间、空闲时间、软件中断时间、nice 时间、等待时间、被盗时间。 
  • 每分钟平均 CPU 使用率(%)。
注意

导航至 CPU 选项卡可查看更多指标。

内存利用率

监控内存使用情况有助于识别使用率不足的服务器并有效重新分配负载,从而在服务器过载导致宕机或数据丢失之前提前检测。

内存使用情况使用 'free' 命令计算。了解更多

内存利用率 = ( ( 总量 - 空闲量 ) / 总量 * 100 )

您还可以将鼠标悬停在内存利用率图表中的某个点上,查看该时间点内存占用最高的五个进程。 进程排名数据使用 Python 模块 'psutil' 计算。

点击标题旁的  图标,可访问内存使用情况的性能报表。报表包含:

  • 交换内存利用率
  • 已用内存
  • 空闲物理内存和空闲交换内存的内存分布。
  • 内存换入页数——从磁盘读取以解决硬性页面错误的页数。
  • 内存换出页数——写入磁盘以释放物理内存空间的页数。
  • 内存页面错误(每秒)——当进程所需的代码或数据不在其工作集(物理内存中的空间)时,就会发生页面错误。了解此指标的计算方式及其在 Site24x7 网页客户端中的显示方式。
  • 每分钟平均内存使用率(%)。
注意

导航至 内存选项卡可查看更多指标。

内存分布

获取服务器中可用空闲物理内存和空闲交换内存的详细分布情况。使用频率较低的文件可以移至交换空间,待需要时再使用,而新文件可以换入 RAM。这有助于更好地规划和分配资源,避免服务器过载和数据丢失。

注意

导航至 内存选项卡可查看更多指标。

打开的文件描述符

此指标显示与操作系统关联的打开文件数量和活动输入/输出资源的唯一标识符数量。了解此关键数据有助于确保资源的最优利用,因为打开的文件意味着内核数据结构和内存等资源的消耗。 

网络吞吐量

特定时间段内网络的数据传输速率。定期监控有助于预测未来需求,确保您的基础设施能够在不中断的情况下处理增加的数据负载。

磁盘使用情况与容量规划

根据当前磁盘使用情况预测七天后的磁盘使用量。如果磁盘使用量和预测值出现异常或突然飙升,则表示存在性能下降问题,需要采取明确行动。进入磁盘选项卡,检查每个分区的磁盘利用率,并在影响服务器整体性能之前解决问题。 


注意

导航至 磁盘选项卡可查看更多指标。

近期事件

了解服务器中的最新事件,按警告、错误和信息分类。数据在每次轮询后刷新,有助于发现错误/警告事件数量的异常增加并及时采取行动。


CPU 和内存占用最高的进程

查看服务器中基于 CPU 或内存使用率的进程排名列表。使用切换按钮在 CPU 和内存使用率之间切换。

应用程序详情

您安装的 Docker 或插件等应用程序将与其对应的监视器显示名称一同列出。点击监视器名称可跳转至相应监视器的摘要页面。  

中断/警告历史

服务器中断和警告状态的完整历史记录,包含中断/警告时段的持续时长、中断原因及根本原因分析(RCA)详情。

进程

监控 Linux 服务器上运行的进程。 如果无法找到在 Linux 服务器上运行的进程,请使用发现进程选项手动添加。 

了解更多进程监控指标和可执行的管理操作。 可通过操作下的铅笔图标为每个进程设置单独的阈值。了解更多

CPU

获取服务器 CPU 利用率的完整数据。 

指标名称 描述
用户空间时间  用于用户进程的 CPU 百分比 
硬件中断时间  处理硬件中断的 CPU 百分比 
空闲时间  处于空闲状态的 CPU 百分比 
软件中断时间  处理软件中断的 CPU 百分比
Nice 时间  处理低优先级进程的 CPU 百分比 
等待时间  等待 I/O 操作的 CPU 百分比 
被盗时间  Hypervisor 宿主机为运行其他虚拟机而占用的时间
系统时间  用于系统进程的 CPU 百分比 
中断与上下文切换 处理器接收的硬件中断平均次数,以及从一个线程切换到另一个线程的速率 
按核心划分的 CPU 利用率 所有中央处理单元或核心的 CPU 利用率。  

内存

获取服务器内存利用率的完整数据。

指标名称 描述
交换内存利用率  服务器中可用的交换空间总量(百分比) 
已用内存  服务器使用的总内存量(字节) 
内存分布  空闲物理内存和空闲交换内存的详细分布 
内存页(换入/换出/页面错误) 分别从磁盘读取和写入磁盘的页数,以及页面错误数量

指标每秒内存页面错误数 通过以下命令从 proc 系统计算得出:

cat /proc/vmstat

要与 Site24x7 网页客户端中显示的值进行核对,请在终端中执行以下命令。该命令将给出自服务器启动以来的页面错误值,Site24x7 网页客户端中以每秒值显示。

cat /proc/vmstat | grep -i 'pgpgin\|pgpgout\|pgfault'

磁盘

密切监控磁盘使用情况并定期检查服务器中的磁盘空间可用性。 查看服务器磁盘分区报表,了解您账户下各服务器的已用和空闲磁盘空间。

指标名称 描述
磁盘分区详情与使用量预测 以表格形式显示已用和空闲磁盘空间(MB 和百分比)。点击数值可查看每个分区的详细性能报表。点击操作下的铅笔图标可为每个分区设置阈值。您也可以使用铅笔图标为任意分区选择跳过告警。 
平均磁盘利用率(%) 服务器中可用的空闲和已用磁盘空间(百分比)
磁盘(I/O) 磁盘上执行的读写操作 
分区磁盘 I/O 每个分区上执行的读写操作
总体磁盘利用率 总磁盘使用量和可用空闲空间(GB)
当前各磁盘利用率(%) 各磁盘分区的最新(最近一次轮询)利用率
磁盘空闲和繁忙百分比 了解磁盘的使用程度以避免过载。如果繁忙时间较高,表示存在过载,且服务器资源分配不够优化。 
注意:Linux 监控代理使用 iostat 工具捕获磁盘空闲和繁忙百分比。请确保您的服务器已安装 iostat 工具。如未安装,请在服务器上安装并重启监控代理服务。 
磁盘 IOPS 显示磁盘每秒执行的输入和输出操作总数。请确保您的服务器已安装 iostat 工具。如未安装,请在服务器上安装并重启监控代理服务。
平均磁盘队列长度 表示磁盘设备命令队列中等待的输入和输出(I/O)请求的平均数量。此指标用于评估磁盘性能和响应能力。请确保您的服务器已安装 iostat 工具。如未安装,请在服务器上安装并重启监控代理服务。
读取延迟 从磁盘存储设备访问数据的时间延迟。
注意:Linux 监控代理使用 iostat 工具捕获磁盘空闲和繁忙百分比。请确保您的服务器已安装 iostat 工具。如未安装,请在服务器上安装并重启监控代理服务。
写入延迟 将数据保存或写入磁盘存储设备所需的时间。
注意:Linux 监控代理使用 iostat 工具捕获磁盘空闲和繁忙百分比。请确保您的服务器已安装 iostat 工具。如未安装,请在服务器上安装并重启监控代理服务。
状态 指示磁盘分区是否可用(正常)或未连接/已移除(中断)。如发生阈值违规,状态将反映磁盘配置的告警严重程度。

磁盘分区详情与使用量预测下,点击重新发现按钮可发现磁盘分区并将其添加至监控。点击批量操作按钮 可一次性为多个磁盘分区设置阈值。 

如需为特定分区设置阈值,请点击操作下分区名称旁的铅笔图标。可以对条件 >、<、=、>= 和 <= 以及字节、KB、MB、GB 和 TB 单位为单个分区设置多个阈值。您可以选择在检测到违规时接收警告或严重告警。

注意

了解更多关于磁盘利用率阈值超出配置值时告警的工作方式。 

网络

在此选项卡中,您可以查看以下网络统计信息:

  • 已发送数据包、已接收数据包、已发送数据量和已接收数据量的图形化表示。
  • 按连接类型划分的总体网络详情,包括:
    • 网络接口名称
    • 最大接口速度
    • 状态
    • 已发送数据量
    • 已接收数据量
    • 带宽使用率
    • 已发送数据包
    • 已接收数据包
    • 错误数据包
  • 各网络接口的详细信息,包括:
    • 网络接口名称
    • MAC 地址
    • IPv4 地址
    • IPv6 地址

点击网络下的某个指标(如输入或输出流量)可获取性能数据的图形化表示。您可以使用操作下的铅笔图标为网络接口设置条件 >、<、=、>= 和 <= 的单独阈值。 

使用批量操作按钮一次性为多个网络接口设置阈值。点击重新发现按钮可发现网络接口并将其添加至监控。 如需查看各服务器关键网络适配器的汇总报表,请查看网络适配器报表。 

注意

每个唯一 MAC 地址对应添加一个网络接口/适配器。如果多个接口具有相同的 MAC 地址,则只添加一个接口,其余接口将被忽略。 

用户

此功能适用于 Linux 服务器监控代理 21.0.00 及以上版本。

在此选项卡中,您可以查看以下数据:

  • 服务器中每个用户 CPU 和内存利用率(百分比)的表格展示。
  • 服务器中所有用户 CPU 利用率(百分比)的图形化展示。
  • 服务器中所有用户内存利用率(百分比)的图形化展示。

点击相应列中的某个指标(如 CPU 利用率或内存利用率)可获取性能数据的图形化表示。您可以使用操作下的铅笔图标为用户资源消耗设置条件 >、<、=、>= 和 <= 的单独阈值。

点击发现用户按钮可发现服务器用户并将其添加至监控。切换最近 24 小时最近一次轮询可分别查看过去 24 小时的平均资源消耗和最新数据采集情况。

注意

用户发现仅列出与活动进程关联的用户。请参阅配置规则帮助手册,了解如何在服务器中自动化精准的服务器用户监控。

设置告警阈值:

  1. 点击操作列中的铅笔图标,为特定用户的资源消耗设置告警阈值。
  2. 点击阈值配置,为任意用户的资源消耗设置告警阈值。

插件

使用 Site24x7 的插件集成,按需定制监控所需的数据。使用我们即装即用的 50+ 插件集成,或使用 Python 或 Shell 脚本编写自定义插件

参数 描述
插件名称 插件监视器的名称
状态 显示插件是否处于正常或中断状态
版本 这是表示插件版本号的必填字段。如果用户需要添加/修改/删除属性,需要更改插件版本以创建新模板。 了解在什么条件下需要更改插件版本
模板名称 包含待监控属性列表的插件模板名称。了解如何配置模板
属性 该插件下列出的属性总数 
性能属性 设置插件模板时,决定哪个属性显示在主摘要页面、日志报表和主插件监视器列表页面中。了解更多
操作 您可以编辑或删除插件监视器

根据服务器上运行的进程,代理将选取相关插件并在推荐插件下列出,方便您向账户添加插件监视器。 

检查项

监控 Linux 服务器上的文件、目录、URL、端口和系统日志等内部资源。点击"创建/编辑资源检查配置文件"可创建/编辑资源检查项。您也可以进入 Site24x7 网页客户端的管理选项卡,点击服务器监控 > 资源检查配置文件,添加要监控的资源。支持监控以下内部资源:

了解更多

系统日志

以图形化格式获取大量数据,详细展示宕机时间、性能下降和安全侵害情况。可从系统日志图表中提取日志程序消息和进程严重性的详细指标。 

用户还可以在系统日志中搜索特定关键字及其出现次数。可按 ID 和来源过滤日志,以便在发生意外行为时立即收到通知。

工具

使用服务器工具在一个地方轻松管理各种操作和执行任务。您也可以通过服务器 > 服务器监控 > 服务器工具 > 从下拉菜单中选择您的 Linux 服务器来访问此页面。

一、进程查看器

获取 Linux 服务器上所有活动进程的完整列表,包含其 CPU(%)使用率、内存(%)使用率、句柄数、线程数和实例数。您可以在顶部的搜索栏在下方截图中以红色高亮显示)中搜索特定进程。您可以使用进程名称旁的 +添加选项(在下方截图中以蓝色高亮显示)将进程添加至监控。

 

添加自定义选项卡

创建您自己的选项卡,监控您所需的性能指标。

添加自定义视图的步骤: 

  1. 点击添加自定义选项卡按钮。
  2. 提供一个显示名称以便识别。
  3. 选择您希望在此视图下查看和监控的指标。
  4. 保存更改。
  5. 点击更多 > 点击您创建的自定义仪表板。 

注意

您可以通过进入编辑自定义视图来编辑显示名称或删除自定义视图。

根本原因分析(RCA)

每次检测到宕机时,系统将根据告警联系人和告警方式向用户发送根本原因分析(RCA)报告。为 Linux 服务器监视器生成的 RCA 提供宕机的实际原因,以及用于诊断连接问题的路由跟踪图。

性能报表

登录 Site24x7 并进入报表 > 服务器监控,即可访问 Linux 监控的性能报表。除了 Site24x7 中所有监视器类型的通用报表外,服务器监控还提供磁盘使用情况、网络适配器详情、代理清单以及 CPU、内存和磁盘 Top N 等专属报表。了解更多。  

服务器清单与健康仪表板

通过我们直观的仪表板全面了解整个服务器环境。

  • 清单仪表板 ——显示所有服务器、应用程序、资源检查项、插件等的数量统计。
  • 健康仪表板——了解账户中所有服务器、插件和应用程序的当前数量和状态。

许可

了解单个 Linux 服务器监视器可获得的指标详情。了解更多

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!