自治数据库监控
Oracle 自治数据库是 Oracle Cloud Infrastructure (OCI) 提供的基于云的自管理数据库服务。它利用人工智能和机器学习,自动执行调优、打补丁、更新、备份和安全等关键数据库管理任务。
概述
Oracle 自治数据库监控是指持续跟踪和分析自治数据库的性能、可用性和资源使用情况的过程。Site24x7 的 Oracle 自治数据库监控涉及对 CPU 使用率、存储利用率、查询响应时间和数据库连接等关键指标的实时观测。

使用场景
假设一家组织使用 Oracle 自治数据库支撑其企业应用,希望确保高可用性和最佳性能。通过将自治数据库与 Site24x7 集成,该组织可以监控资源利用率、数据库可用性和查询性能等各种关键指标。
例如,如果在流量高峰期检测到性能瓶颈,Site24x7 会实时向管理员发出告警。随后,管理员可以分析详细报表并进行必要优化,以防止出现重大性能下降影响应用。
Site24x7 自治数据库集成的优势
将您的自治数据库与 Site24x7 集成,可以:
- 全面了解整个 OCI 基础架构中自治数据库的性能。
- 在阈值突破时立即收到告警,快速响应潜在问题。
- 识别运营瓶颈并优化数据库工作负载。
- 计划 IT 自动化,随时启动、重启或停止数据库。
设置与配置
- Site24x7 使用跨租户访问,通过 Site24x7 的租户用户监控您的资源。登录您的 Site24x7 账户,创建特定策略,允许 Site24x7 查看您的资源而不影响安全性。
- 在添加 OCI 监视器页面,从要发现的服务列表中选择自治数据库。
权限
请确保 Site24x7 获得以下权限以监控自治数据库:
- listAutonomousDatabases - AUTONOMOUS_DATABASE_INSPECT
- GetAutonomousDatabase - AUTONOMOUS_DATABASE_INSPECT
- listAutonomousDatabaseBackups - AUTONOMOUS_DB_BACKUP_INSPECT
轮询频率
Site24x7 根据设定的轮询频率(从每分钟一次到每天一次)查询 OCI 服务级 API,以从自治数据库监视器收集指标。
支持的指标
自治数据库监视器支持的指标如下所示。
专用 Exadata 基础架构类型支持的指标
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| 应用延迟 | 在采样时刻,备用数据库落后于主数据库的时间(秒)。 | Sum | 秒 |
| DB 块更改数 | 每秒平均块更改数。 | Sum | 每秒次数 |
| 已分配 ECPU 数 | 在所选时间间隔内,服务实际分配的弹性计算处理单元(ECPU)数量。 | Sum | Count |
| IOPS | 每秒平均 I/O 操作数。 | Sum | 每秒次数 |
| IO 吞吐量 | 每秒平均吞吐量(MB)。 | Sum | 每秒 MB |
| 逻辑读取数 | 每秒平均逻辑块读取数("db block gets"与"consistent gets"之和),包括缓冲和直接 I/O。时间间隔:1 分钟。 | Sum | 每秒次数 |
| 已分配 OCPU 数 | 在所选时间间隔内,服务实际分配的 Oracle CPU(OCPU)数量。 | Sum | Count |
| 按类型解析数 | 每秒硬解析或软解析次数。 | Sum | 每秒次数 |
| 已生成 Redo 量 | 每秒平均生成的 Redo 量(MB)。 | Sum | 每秒 MB |
| 按表空间分配的存储空间 | 在时间间隔内,每个表空间分配的最大空间量。 | Maximum | GB |
| 按表空间使用的存储空间 | 在时间间隔内,每个表空间使用的最大空间量。 | Maximum | GB |
| 按表空间的存储空间利用率 | 每个表空间已使用空间的百分比。 | Average | 百分比 |
| 按状态的事务数 | 每秒已提交或已回滚的事务数。 | Sum | 每秒次数 |
| 传输延迟 | 在采样时刻,备用数据库尚未接收到的 Redo 的近似秒数。 | Sum | 秒 |
无服务器模式支持的指标
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| 连接延迟 | 从同一区域的计算服务虚拟机连接到每个区域的 Oracle 自治数据库无服务器实例所需的时间。时间间隔:5 分钟。 | Maximum | 毫秒 |
| 数据库可用性 | 数据库在给定分钟内是否可连接,可能的值为:1 = 数据库可用,0 = 数据库不可用。时间间隔:1 分钟。 | Average | Count |
| 失败连接数 | 失败的数据库连接数。时间间隔:1 分钟。 | Sum | Count |
| 失败登录数 | 在所选时间间隔内,因无效用户名和/或密码导致登录失败的次数。时间间隔:1 分钟。 | Average | Count |
| 解析次数(硬解析) | 在所选时间间隔内的硬解析调用次数(即真正的解析)。硬解析是一种内存消耗较大的操作,因为它需要 Oracle 分配工作堆和其他内存结构,然后构建解析树。时间间隔:1 分钟。 | Sum | Count |
| 逻辑读取数 | 在所选时间间隔内,"db block gets"与"consistent gets"的总和,包括从缓冲区缓存或进程私有内存读取的数据库块。 | Sum | Count |
| 失败解析次数 | 在所选时间间隔内的解析失败次数。时间间隔:1 分钟。 | Sum | Count |
| 物理读取数 | 在所选时间间隔内,从磁盘读取的数据块数。时间间隔:1 分钟。 | Sum | Count |
| 物理读取总字节数 | 在所选时间间隔内,所有数据库实例活动(包括应用读取、备份恢复和其他工具)的磁盘读取大小(字节)。时间间隔:1 分钟。 | Sum | Count |
| 物理写入数 | 在所选时间间隔内,写入磁盘的数据块数。时间间隔:1 分钟。 | Sum | Count |
| 物理写入总字节数 | 在所选时间间隔内,所有数据库实例(包括应用活动、备份恢复和其他工具)的磁盘写入大小(字节)。时间间隔:1 分钟。 | Sum | Count |
| 查询延迟 | 在用户屏幕上显示简单查询结果所需的时间。时间间隔:5 分钟。 | Maximum | 毫秒 |
| 排队语句数 | 在所选时间间隔内,跨所有消费者组聚合的排队 SQL 语句数。时间间隔:1 分钟。 | Sum | Count |
| 已生成 Redo 量 | 在所选时间间隔内生成的 Redo 量(字节)。时间间隔:1 分钟。 | Sum | Count |
| 运行中语句数 | 在所选时间间隔内,跨所有消费者组聚合的正在运行的 SQL 语句数。时间间隔:1 分钟。 | Average | Count |
| 会话数 | 数据库中的会话数。时间间隔:1 分钟。 | Sum | Count |
| 通过 SQL*Net 从客户端接收的字节数 | 在所选时间间隔内,通过 Oracle Net Services 从客户端接收的字节数。时间间隔:1 分钟。 | Sum | Count |
| 通过 SQL*Net 从 DBLink 接收的字节数 | 在所选时间间隔内,通过 Oracle Net Services 从数据库链接接收的字节数。时间间隔:1 分钟。 | Sum | Count |
| 通过 SQL*Net 发送给客户端的字节数 | 在所选时间间隔内,前台进程发送给客户端的字节数。时间间隔:1 分钟。 | Sum | Count |
| 通过 SQL*Net 发送给 DBLink 的字节数 | 在所选时间间隔内,通过数据库链接发送的字节数。时间间隔:1 分钟。 | Sum | Count |
| 用户提交数 | 在所选时间间隔内的用户提交次数。当用户提交事务时,反映数据库块更改的生成 Redo 必须写入磁盘。提交通常代表最接近用户事务速率的指标。时间间隔:1 分钟。 | Sum | Count |
| 用户回滚数 | 在所选时间间隔内,用户手动执行 ROLLBACK 语句或用户事务发生错误的次数。时间间隔:1 分钟。 | Sum | Count |
| 活跃 APEX 应用数 | 活跃 APEX 应用程序的数量。 | Sum | Count |
| APEX 页面事件数 | APEX 页面事件的数量。 | Sum | Count |
| APEX 页面加载时间 | APEX 页面加载时间。 | Average | 秒 |
| APEX 工作区数 | APEX 工作区的数量。 | Sum | Count |
专用 Exadata 基础架构类型和无服务器模式均支持的指标
| 指标名称 | 描述 | 统计方式 | 单位 |
|---|---|---|---|
| CPU 时间 | 数据库中前台会话在时间间隔内积累 CPU 时间的平均速率。时间间隔:1 分钟。 | Average | 秒 |
| CPU 利用率 | 以百分比表示的 CPU 使用率,跨所有消费者组聚合。利用率百分比相对于数据库允许使用的 CPU 数量而言。时间间隔:1 分钟。 | Average | 百分比 |
| 用户调用数 | 在所选时间间隔内,登录、解析和执行调用的总次数。时间间隔:1 分钟。 | Sum | Count |
| 已分配存储空间 | 在时间间隔内,为所有表空间分配给数据库的空间量。时间间隔:1 小时。 | Maximum | GB |
| 最大存储空间 | 在时间间隔内,为数据库预留的最大存储量。时间间隔:1 小时。 | Maximum | GB |
| 已使用存储空间 | 在时间间隔内使用的最大空间量。时间间隔:1 小时。 | Maximum | GB |
| 存储利用率 | 当前为所有数据库表空间分配的已预留最大存储空间的百分比,代表所有表空间的总预留空间。时间间隔:1 小时。 | Average | 百分比 |
| 事务数 | 在所选时间间隔内,用户提交和用户回滚的总次数。时间间隔:1 分钟。 | Sum | Count |
| 当前登录数 | 在所选时间间隔内,成功登录的次数。时间间隔:1 分钟。 | Sum | Count |
| 解析次数(总计) | 在所选时间间隔内的硬解析和软解析总次数。时间间隔:1 分钟。 | Sum | Count |
| DB 块更改数 | 在系统全局区域(SGA)中所有块上执行更新或删除操作的更改数量。此类更改会生成 Redo 日志条目,并在事务提交时成为数据库的永久更改。这近似于数据库的总工作量,表示在所选时间间隔内缓冲区被标记为脏缓冲区的速率。时间间隔:1 分钟。 | Sum | Count |
| DB 时间 | 数据库用户会话执行数据库代码所花费的时间(CPU 时间 + 等待时间)。DB 时间用于推断数据库调用延迟,因为 DB 时间与数据库调用延迟(响应时间)和调用量成正比增加。计算方式为数据库中前台会话积累数据库时间的平均速率。时间间隔:1 分钟。 | Average | 秒 |
| 执行次数 | 在所选时间间隔内,执行 SQL 语句的用户调用和递归调用次数。时间间隔:1 分钟。 | Sum | Count |
| 等待时间 | 数据库中前台会话积累非空闲等待时间的平均速率。时间间隔:1 分钟。 | Average | 秒 |
| 活跃备份数 | 处于活跃状态的备份数量。 | Sum | Count |
| 已删除备份数 | 处于已删除状态的备份数量。 | Sum | Count |
| 失败备份数 | 处于失败状态的备份数量。 | Sum | Count |
| 增量备份数 | 增量类型的备份数量。 | Sum | Count |
| 全量备份数 | 全量备份类型的备份数量。 | Sum | Count |
| 长期备份数 | 长期类型的备份数量。 | Sum | Count |
阈值配置
为自治数据库监视器配置阈值的步骤:
- 登录您的 Site24x7 账户,导航至管理 > 配置文件 > 阈值与可用性。
- 单击添加阈值配置文件。
- 从监视器类型下拉菜单中选择自治数据库,并在显示名称字段中填写合适的名称。
- 支持的指标将显示在阈值配置部分。您可以为上述所有指标设置阈值。
- 单击保存。
预测
使用预测功能,预测 CPU 利用率、CPU 时间和存储利用率指标的未来值。根据历史观测数据预测这些性能指标(资源使用量的衡量)的未来走势,并做出明智决策。
IT 自动化
您可以添加自动化操作,以启动、停止或重启自治数据库。前往管理 > IT 自动化模板 (+) > 添加自动化模板。添加自动化后,您可以安排它们依次执行。
许可证
每个自治数据库监视器使用一个基础监视器许可证。
查看自治数据库数据
要监控您的自治数据库环境,请登录您的 Site24x7 账户,导航至云 > OCI > 自治数据库。
监视器数据
以下是自治数据库监视器的监控数据。
摘要
摘要选项卡以图表形式全面概述事件时间线和指标,呈现有助于了解自治数据库监视器性能的深入洞察。
配置详情
配置详情选项卡汇总了自治数据库的基本信息,包括部署类型、创建时间、灾难恢复数据和备份配置详情。
备份详情
备份详情选项卡以表格形式列出为自治数据库创建的备份。单击备份 ID 可查看每条备份的详情。
中断记录
中断记录选项卡提供中断的开始时间、结束时间、持续时长和备注(如有)等详情。
清单
在清单选项卡中,您可以获取资源名称、区域、监视器许可证类别等详情。可在此选项卡中根据用户设置和查看阈值与可用性配置文件及通知配置文件。
日志报表
此选项卡提供自治数据库监视器日志状态的汇总报表,可下载为 CSV 文件。
相关主题
