帮助手册

Site24x7 中的阿里云监控

使用 Site24x7 监控您的阿里云基础设施,深入了解云资源的健康状况、可用性和性能。从单一统一监控控制台自动发现服务、配置阈值、接收告警并自动化事件修复。

入门

要开始监控您的阿里云环境,请按照步骤添加阿里云监视器

支持的阿里云服务

Site24x7 支持对 40 余项阿里云服务的开箱即用监控。新支持的服务将根据您设定的发现间隔自动发现并添加。

所需权限

要允许 Site24x7 访问您的阿里云环境,您需要:

  • 创建具有只读权限的 Access Key IDAccess Key Secret
  • 确保已为 RAM 用户分配所需策略(例如 AliyunReadOnlyAccess)。
  • 在 Site24x7 控制台中使用这些凭证进行身份验证并开始监控。

以下服务级策略提供最小权限读取访问。您也可以附加 ReadOnlyAccess 以覆盖所有读取权限。

服务推荐策略用途
ECSAliyunECSReadOnlyAccess获取虚拟机和实例数据
ACK(Kubernetes)AliyunCSReadOnlyAccess列出集群、节点和工作负载
ECIAliyunECIReadOnlyAccess监控容器实例
SLBAliyunSLBReadOnlyAccess发现负载均衡器
RDSAliyunRDSReadOnlyAccess检索数据库监控指标

创建和管理 Access Key

Site24x7 使用 Access Key 身份验证连接到您的阿里云账户。您的凭证经过安全存储和加密。请按以下步骤为 RAM 用户生成 Access Key ID 和 Access Key Secret。

前提条件

  • 您必须拥有至少具备 RAM(资源访问管理)用户权限的阿里云账户。
  • 您的 RAM 用户应具有程序化访问权限,以及访问所需资源(例如 ECS、ACK、ECI、弹性伸缩)的必要权限。
  • 您必须能够访问阿里云控制台。

步骤 1:登录阿里云控制台

  1. 访问 https://home.console.aliyun.com
  2. 使用阿里云根账户或授权 RAM 用户登录。
注意

建议避免直接使用根账户进行 API 集成,而应使用具有最小权限访问的 RAM 用户。

步骤 2:打开 RAM 控制台

  1. 在顶部导航栏中选择资源访问管理(RAM),或直接访问 https://ram.console.aliyun.com/users
  2. 在左侧菜单中单击用户查看现有用户,或单击创建用户添加新用户。

步骤 3:创建或选择 RAM 用户

如果您已有用于监控的 RAM 用户,请单击用户名打开用户详情页面。

如果尚未创建:

  1. 单击创建用户
  2. 输入用户名(例如 site24x7-monitoring-user)。
  3. 选择访问方式,启用使用永久 AccessKey 访问——此操作将生成 Access Key。
  4. 可选择启用控制台访问以进行手动测试。
  5. 单击确定创建用户。
  6. 立即下载 CSV 格式的 Access Key 和 Secret。
注意

关闭对话框后将无法再次查看 Access Key Secret。请在继续操作前妥善保存。

步骤 4:为 RAM 用户分配权限

  1. 在 RAM 用户详情页面,单击权限 > 授予权限
  2. 选择您的云账号作为授权范围。
  3. 搜索并选择所需策略(请参阅上方权限表)。
  4. 单击确定

步骤 5:为现有 RAM 用户生成 Access Key

  1. RAM 用户详情页面,单击创建 AccessKey
  2. 系统将生成一对凭证:AccessKey IDAccessKey Secret
注意

请妥善复制并保存两个密钥——关闭对话框后将无法再次查看 Secret。请将其存储在监控工具配置中,避免通过聊天、电子邮件或代码仓库共享 AccessKey。

添加监视器

您可以在 Site24x7 中添加阿里云监视器,自动发现和监控您的阿里云资源,例如 ECS、RDS、SLB、OSS 等。Site24x7 使用基于密钥的身份验证安全连接到您的阿里云账户并获取监控数据。

  1. 登录您的 Site24x7 账户
  2. 在 Site24x7 控制台中导航至 > 阿里云 > 添加监视器
  3. 为监视器输入显示名称
  4. 设置发现间隔,控制 Site24x7 轮询新资源的频率,可选 15 分钟、30 分钟或 1 小时。请选择与基础设施变更频率相匹配的间隔。
  5. 通过关联监视器组选项选择或创建监视器组,以逻辑方式组织您的资源。
  6. 身份验证下,使用基于密钥的身份验证提供凭证:
    • 按照界面提示,从阿里云 资源访问管理(RAM)控制台生成 AccessKey ID 和 AccessKey Secret。
    • 在相应字段中输入您的 Access Key IDAccess Key Secret
  7. 资源组下:
    • 资源组下拉菜单中选择要监控的资源组。
    • 自动添加新资源组进行监控切换为启用,以自动发现并添加新资源组进行监控。
  8. 发现设置下:
    • 服务/资源类型下拉菜单中选择要监控的阿里云服务类型。默认情况下,将选择您阿里云账户中的所有资源组和支持的服务类型进行监控。
    • 自动发现新资源切换为启用,以在下次发现周期中自动发现和监控添加到您阿里云账户的任何新资源。
  1. 按标签筛选下:
    • 基于标签包含资源:根据偏好在 ORAND 之间切换。输入和值以匹配要纳入监控的资源,该选项将从您的阿里云账户中包含匹配资源并添加进行监控。
    • 基于标签排除资源:根据偏好在 ORAND 之间切换。输入和值以匹配要从监控中排除的资源,该选项将从您的阿里云账户中排除匹配资源。
  2. 常规设置下:
    • 基础监视器许可证单元耗尽时发送通知切换为,以在基础监视器许可证单元不足时接收告警。请注意,许可证单元耗尽将影响新资源的添加。
    • 许可证单元耗尽后停止重新发现切换为,以防止许可证耗尽后继续发现。
    • 使用所有资源的标签将 Site24x7 标签关联到此监视器下发现的所有资源。
  3. 资源终止设置下:
    • 若不希望在已终止资源从 Site24x7 自动暂停或删除时收到告警,请将静音资源终止告警切换为
    • 继续监控已终止资源切换为,以确保对已终止资源持续监控,该监视器将被标记为宕机,并在手动暂停之前持续轮询。
    • 自动删除已终止资源切换为,以自动从监控中删除已终止的资源。
      • 若此字段设为:受监控资源将进入已删除状态。
      • 若此字段设为:受监控资源将在规定时间内进入已暂停状态。
    • 设置资源终止后保留时间,确定已终止资源在 Site24x7 控制台中永久删除前的保留天数。
  4. 自动分配阈值配置文件下:
    • 覆盖现有阈值配置文件切换为,可将修改后的阈值配置文件应用于该服务的现有监视器;设为则保留现有设置,仅对尚未添加监控的资源应用修改后的默认阈值配置文件。
    • 使用为所选服务配置默认阈值配置文件选择要配置首选阈值配置文件的服务类型,可创建新配置文件或选择现有配置文件。
  1. 配置文件下:
    • 阈值与可用性:选择所需的阈值与可用性配置文件,告警引擎将据此判断特定资源是否需要声明为严重或宕机状态。可选择现有配置文件,或使用 + 图标创建新配置文件,也可使用铅笔图标编辑现有配置文件。
    • 标签:将 Site24x7 标签关联到此监视器,用于筛选和报表。
    • IT 自动化模板:选择自动化模板并定义执行时机(例如在宕机时执行),以在发生阈值超出时自动修复问题。
  2. 告警设置下:
    • 用户告警组:选择应接收此监视器告警通知的用户组。
    • 值班计划:可选择指定值班计划,在正确的时间将告警路由至正确的团队。
    • 通知配置文件:选择现有通知配置文件或创建新配置文件,以定义告警的发送方式和时机。
  3. 第三方集成下:将 Site24x7 告警与您首选的第三方服务集成。转到管理 > 第三方集成配置活跃集成。
  4. 单击发现阿里云资源以开始监控。
注意

自定义阿里云监视器后,发现您首选的阿里云资源最多需要 30 分钟。

查看阿里云资源

导航至阿里云 > 选择阿里云账户 > 单击相应监视器,即可查看该资源的性能指标。

仪表板

成功创建阿里云监视器后,您将被引导至服务视图页面。所有阿里云资源将在几分钟内添加到 Site24x7 用户控制台。

除此服务视图仪表板外,还提供三个专属仪表板。您还可以创建自定义仪表板、执行管理操作并检测关键异常。

监控配置

阈值与可用性

为每项服务设置自定义阈值配置文件,主动检测性能问题或中断。

标签

使用标签按资源类型、环境(生产/测试/开发)或所有者对监视器进行分类和筛选。从您阿里云账户导入的标签会自动同步。对于每个资源,将创建包含位置和资源类型的 Site24x7 阿里云标签。

标签格式如下:

location: {location}
serviceType: {monitortype}

IT 自动化模板

Site24x7 使您能够在监视器进入异常或宕机状态时自动执行纠正措施。您可以:

  • 重启资源
  • 触发自定义脚本或 Webhook
  • 停止/启动 ECS 实例

执行设置:在宕机时执行在异常时执行在恢复时执行

相关链接

Site24x7 监控的阿里云服务

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!