时间漂移监视:不同步服务器的故障

分布式IT基础设施有许多服务器跨多个区域运行。跨服务器应用单一一致的时间将确保隔离的服务器在暴露于internet时在适当的时区通信。

当微软在2017年遇到这个问题时,服务器被抵消了近一个小时,影响了许多windows机器。而Reddit则是另一种情况。一个“闰秒”故障捕获了在循环中运行的所有Java进程,从而消耗了CPU的能量,并导致站点崩溃了一段时间。 跨服务器甚至网络设备保持一致和准确的时间是至关重要的。否则,企业可能会遇到以下任何问题。

Active Directory (AD)复制冲突

当AD复制发生时,跨所有域控制器(DCs)一致地更新信息。如果不同的DCs操作的时间不匹配,甚至只有几秒钟,那么并发操作可能会导致复制冲突。

身份验证失败

如果发送身份验证请求的服务器的时钟设置与接收请求的服务器不同,则身份验证请求将超时。此外,服务器的时钟不同步会增加重播攻击和同一身份验证的多次重用的可能性。这就是为什么在AD环境中的Kerberos身份验证中使用时间戳。

用于故障排除的错误日志

当问题发生时,业务依赖日志来确定问题的根源。在多个时区中有日志条目会使故障排除过程变得单调乏味,而且确定问题发生的确切时间也很困难。

不一致的报告

时间上的细微差别导致数据报告不一致。跨服务器保持一致的时间将防止报表中的数据出现偏差,从而帮助IT团队做出不影响基础设施操作的决策。

如何同步服务器之间的时间

IT行业广泛接受的解决方案是使用网络时间协议(NTP)服务器来同步系统的时钟。然而,连接到NTP服务器仍然可能导致几秒钟的不一致性。这是由于网络流量和必须通过多个路由器的连接造成的不可预测的延迟造成的。

现场24x7救援

建议与本地NTP服务器同步时间并监视时间漂移,以确保增加了一层保证。使用Site24x7作为监控系统可以减少周转时间,从而识别时间漂移并采取纠正措施。Site24x7提供了将被监视的服务器配置为主服务器和将公共NTP服务器配置为辅助服务器的功能。如果任何服务器超出配置的阈值,此设置将向IT团队发出警告。在停机期间跟踪异常和故障排除时,设置正确的时间将非常有用。 阅读我们的帮助文档,了解如何开始一步一步的指导,然后点击这里注册免费的30天试用版Site24x7。

计划,定价和注册30天免费试用,立即注册