帮助手册

使用 Site24x7 进行 OCI 监控的最佳实践 

Site24x7 对 Oracle Cloud Infrastructure (OCI) 的监控支持可通过收集 OCI 服务的性能、可用性和成本相关数据,为您的云基础设施提供全面可见性。为确保有效且优化的监控,请按照以下按关键功能领域分类的最佳实践操作。

确保遵循部署方法

OCI 门户配置

  • 访问权限配置:通过配置适当的身份和访问管理 (IAM) 策略,确保 Site24x7 在 OCI 中拥有充足的权限
  • 网络连接:为顺畅监控云托管虚拟机 (VM),需将 Site24x7 的 IP 地址和域名加入白名单,以防止连接中断。

Site24x7 OCI 监视器设置

  • 通过向 Site24x7 授予访问 OCI 资源的必要权限,启用全面监控。
  • 使用 Site24x7 的高级配置,根据您的需求自定义监控。

优化指标采集

  • 为关键资源配置细粒度数据采集,确保性能追踪的准确性。
  • 使用资源过滤功能,仅监控必要的服务,减少不必要的数据开销。
  • 结合 OCI 原生指标与 Site24x7 的监控,获取完整视图。

配置阈值

  • 默认阈值配置文件:为常见 OCI 服务设置预定义的阈值配置文件,确保告警的一致性。
  • 动态基线:使用异常检测功能,根据历史性能趋势自动调整阈值。
  • 告警抑制配置非工作时间或维护窗口,以抑制非可操作告警。

设置仪表板

生成报表

  • 生成定期报表,进行历史性能分析。
  • 使用指导报表,获取优化 OCI 配置的最佳实践建议。

使用标签改善监控

  • 在 OCI 和 Site24x7 中应用资源标签,高效地对监视器进行分类和管理。
  • 使用标签进行成本分摊追踪、环境隔离(如生产、开发、测试)和基于服务的分组(如数据库、计算、存储)。

使用告警和通知保持信息同步

  • 通过电子邮件、短信或 ITSM 工具(如 ServiceNow 和 PagerDuty)配置实时告警。
  • 第三方通知平台(Slack、Microsoft Teams 等)集成,增强告警能力。
  • 设置维护窗口,在计划内宕机时间期间抑制告警。

遵循以上最佳实践,您可以最大化发挥 Site24x7 OCI 监控的效能,确保最佳性能、可靠性和主动问题解决。定期审查配置并利用 Site24x7 的建议,以维持稳健的云监控策略。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!