服务级别指标
服务级别指标(SLI)是用于衡量服务性能或可靠性的独特指标。它是定义服务级别目标(SLO)的基础,有助于量化可用性、延迟、吞吐量和错误率等方面的表现。
在 Site24x7 中,SLI 来源于从各类来源(如网站监视器、服务器监视器、应用性能监控(APM)、网络监视器等)收集的实时监控数据。
如何确定 SLI?
SLI 通过从现有监视器中选择相关关键绩效指标(KPI)来确定。SLI 包括可用性、延迟、响应时间、吞吐量和内存使用率等。这些指标反映了影响客户体验的参数,用于评估服务健康状况。Site24x7 提供三种不同的评估方法来计算 SLI:基于时间的评估、基于时间片的评估和基于计数的评估。以下逐一介绍并举例说明。
假设您正在监控 DNS 服务器,以确保用户能够成功解析域名。
- 基于时间的评估追踪服务在特定时段内保持正常运行的时长。
- 示例:您的 DNS 服务器在过去 24 小时内持续受到监控。它在 23 小时内正常运行并正确响应。据此,您的 SLI 即为 DNS 服务器的正常运行时间。
- 基于时间片的评估将时间划分为若干区间,检查服务在每个时间片内是否达到预期标准。
- 示例:您每小时对 DNS 服务器进行一次检查,全天共检查 24 次。其中 20 次检查中,服务器满足了性能预期(即响应快速、无错误)。因此,您的 SLI 即为满足要求的时间片数量的比值。
- 基于计数的评估计算成功事件数与总事件数之比。
- 示例:一天内,您向服务器发送了 100 次 DNS 查询。其中 95 次收到了有效且及时的响应,5 次失败或超时。由此得出的 SLI 为 (95/100) × 100 = 95% 的成功率。
通过选择合适的指标和评估方法,您可以为服务设定可衡量、切实可行的目标,实时追踪性能,并确保客户满意度。借助灵活的配置选项和全面的洞察能力,Site24x7 中的 SLI 功能使您能够主动管理服务质量,并始终与服务级别承诺保持一致。
