帮助手册

Base Database Service 监控

Oracle Cloud Infrastructure(OCI)中的 Base Database Service 是一种托管数据库服务,支持您部署 Oracle 数据库并对数据库环境拥有完全控制权。它同时支持单实例数据库和多租户容器数据库,后者可托管多个可插拔数据库(PDB)。这种灵活的架构非常适合需要隔离性、可扩展性和简化数据库管理的企业级工作负载。

说明

Site24x7 目前支持监控与 Oracle Base Database 服务组相关联的 DB System。

概述

Site24x7 提供与 Base Database Service 的无缝集成,支持您有效监控自治或托管数据库实例。集成完成后,Site24x7 除了创建 Base Database 监视器外,还会自动发现并创建以下子监视器:

  • 数据库:追踪 Base Database Service 实例,无论是独立数据库还是容器数据库。它捕获 CPU 利用率、内存使用率、IOPS、存储和正常运行时间等关键指标,并提供健康状态和运行洞察,确保整体数据库环境平稳运行。
  • 可插拔数据库:提供对托管在容器数据库中各 PDB 的可见性,追踪会话数、存储使用量、开放模式(只读或读写)和可用性等指标。这种精细度对于在 PDB 层面诊断问题和优化应用程序性能至关重要。

这套全面的监控设置为数据库基础架构的健康状况、性能和可用性提供深度可见性。

使用场景

某金融服务公司在 OCI 托管的 Oracle Base Database 上运行关键业务应用程序。在交易高峰期,应用程序团队发现性能下降,但缺乏对根本原因的可见性。 

借助 Site24x7 对 Base Database Service 监控的集成,运维团队可以实时了解每个数据库实例和 PDB 的 CPU 峰值、会话增长和 IOPS 指标。通过分析来自"数据库"和"可插拔数据库"子监视器的关联数据,他们迅速发现某个 PDB 的会话活动异常高,导致容器数据库(CDB)层面的资源争用。 

告警日志和预测报表进一步帮助他们验证该问题已持续累积了一段时间。据此洞察,团队重新分配工作负载并扩展受影响节点,恢复了应用程序性能。这种主动监控方式有效防止了服务中断,确保了 SLA 合规,并提升了客户满意度。

Site24x7 Base Database Service 集成的优势

Site24x7 与 Base Database Service 的集成支持您:

  • 监控 Base Database Service 部署的所有层级,从基础实例到可插拔单元。
  • 在容器化环境中高效管理 PDB。
  • 分析历史性能趋势并预测未来资源需求,支持主动容量规划和成本优化。
  • 在检测到潜在威胁时接收告警,并及时采取措施加以处理。

设置与配置

  • Site24x7 使用跨租户访问,通过 Site24x7 的租户用户监控您的资源。登录 Site24x7 账户并创建特定策略,允许 Site24x7 查看您的资源而不影响您的安全设置。
  • 集成 OCI 监视器页面上,从待发现服务列表中选择 Base Database

策略与权限

请确保相关 OCI 策略包含以下声明:

Allow group <your-group-name> to read the database-family in compartment <your-compartment-name>
Allow group <your-group-name> to inspect the database-family in compartment <your-compartment-name>

请确保 Site24x7 具备以下权限以监控您的 Base Database Service 实例:

  • ListDbSystems - DB_SYSTEM_INSPECT
  • GetDbSystem - DB_SYSTEM_INSPECT
  • ListDbHomes - DB_HOME_INSPECT
  • ListDatabases - DATABASE_INSPECT
  • GetDatabase - DATABASE_INSPECT
  • ListPluggableDatabases - PLUGGABLE_DATABASE_INSPECT
  • getPluggableDatabase - PLUGGABLE_DATABASE_INSPECT

轮询频率

Site24x7 根据设定的轮询频率(从每分钟一次到每天一次)查询 OCI 服务级别 API,以从 Base Database 监视器采集指标。

支持的指标

Base Database 监视器支持的指标如下。

Base Database

oci_database_cluster namespace 中 DB System 支持的指标 

指标名称 描述 统计方式 单位
ASM Diskgroup Utilization 磁盘组中可用空间的使用百分比。 最大值 百分比
Filesystem Utilization 已配置文件系统的使用百分比。 平均值 百分比
CPU Utilization CPU 使用百分比。 平均值 百分比
Memory Utilization 可用于启动新应用程序(无需交换)的内存百分比。 平均值 百分比
Swap Utilization 总交换空间的使用百分比。 平均值 百分比
Load Average 五分钟内的系统平均负载。 平均值 数量
Node Status 指示主机在 RAC 环境中是否可达。 平均值 数量
OCPU Allocated 已分配的 OCPU 数量。 平均值 数量

数据库

对于数据库子监视器,如果已启用 Database Management 选项,您可以使用 oracle_oci_database namespace 中的指标监控 Base Database Service 的健康状况、容量和性能。 

数据库监视器支持的基础管理指标 

指标名称 描述 统计方式 单位
Monitoring Status 资源的监控状态。 平均值 数量
OCPU Allocated 在所选时间间隔内,服务实际分配的 OCPU 数量。 最大值 数量

数据库监视器支持的完整管理指标

指标名称 描述 统计方式 单位
Allocated Storage Utilization By Tablespace 表空间已使用空间占已分配空间的百分比。 平均值 百分比
CPU Time 在时间间隔内,数据库实例中前台会话累积 CPU 时间的平均速率。 平均值 秒/秒
DB Time 在时间间隔内,数据库实例中前台会话累积数据库时间(CPU + 等待)的平均速率。 平均值 秒/秒
FRA Space Limit 闪回恢复区的空间限制。 最大值 GB
FRA Utilization 闪回恢复区的使用率。 平均值 百分比
IOPS 每秒平均 IO 操作次数。 平均值 操作次数/秒
IO Throughput 每秒平均吞吐量(MB)。 平均值 MB/秒
Logical Blocks Read 每秒从 SGA/内存(缓冲区缓存)中读取的平均块数。 平均值 读取次数/秒
Max Tablespace Size 表空间的最大可能大小。对于 CDB,此指标提供根容器表空间的数据。 最大值 GB
Memory Usage 内存池的总大小。 平均值 MB
Monitoring User Password Expiration 监控用户密码到期前的剩余天数。 最新值 数量
Non Reclaimable FRA 不可回收的快速恢复区。 平均值 百分比
Parses By Type 每秒硬解析或软解析次数。 平均值 解析次数/秒
Processes 数据库进程数量。 最大值 数量
Process Limit Utilization 进程限制使用率。 平均值 百分比
Reclaimable FRA 可回收的快速恢复区。 平均值 百分比
Reclaimable FRA Space 闪回恢复区的可回收空间。 平均值 GB
Redo Generation Rate 主数据库上的 redo 生成速率。 平均值 MB/秒
Redo Size 生成的平均 redo 量。 平均值 MB/秒
Session Limit Utilization 会话限制使用率。 平均值 百分比
Sessions 数据库中的会话数量。 平均值 数量
Transactions By Status 每秒已提交或已回滚的事务数量。 平均值 事务次数/秒
Usable FRA 可用的快速恢复区。 平均值 百分比

oci_database namespace 中 DB System 的指标

指标名称 描述 统计方式 单位
CPU Utilization CPU 使用百分比,跨所有消费者组聚合。使用率以数据库允许使用的 CPU 数量为基准,即 OCPU 数量的两倍。 平均值 百分比
Storage Utilization 当前已使用的已配置存储容量百分比,代表所有表空间的总分配空间。 平均值 百分比
DB Block Changes 每秒平均更改的块数。 平均值 变更次数/秒
Execute Count 在所选时间间隔内,执行 SQL 语句的用户调用和递归调用次数。 总和 数量
Current Logons 在所选时间间隔内成功登录的次数。 平均值 数量
Transaction Count 在所选时间间隔内,用户提交和用户回滚的总次数。 总和 数量
User Calls 在所选时间间隔内,登录、解析和执行调用的总次数。 总和 数量
Parse Count 在所选时间间隔内,硬解析和软解析的次数。 平均值 数量
Storage Space Used 采集时数据库已使用的总存储空间。 最大值 GB
Storage Space Allocated 采集时分配给数据库的总存储空间。 最大值 GB
Storage Space Used By Tablespace 采集时表空间已使用的总存储空间。对于容器数据库,此指标提供根容器表空间的数据。 最大值 GB
Allocated Storage Space By Tablespace 采集时分配给表空间的总存储空间。对于容器数据库,此指标提供根容器表空间的数据。 最大值 GB
Storage Space Utilization By Tablespace 采集时表空间存储空间的使用百分比。对于容器数据库,此指标提供根容器表空间的数据。 最大值 百分比

可插拔数据库

可插拔数据库监视器的指标仅在为该 PDB 启用了 Database Management 选项后才可用。 

可插拔数据库监视器支持的基础管理指标

指标名称 描述 统计方式 单位
Block Changes 每秒平均更改的块数。 平均值 变更次数/秒
CPU Utilization CPU 使用百分比,跨所有消费者组聚合。 平均值 百分比
Current Logons 在所选时间间隔内成功登录的次数。 总和 数量
Execute Count 在所选时间间隔内,执行 SQL 语句的用户调用和递归调用次数。 总和 数量
Monitoring Status 资源的监控状态。 平均值 NA
OCPU Allocated 在所选时间间隔内,服务实际分配的 OCPU 数量。 数量 数量
Parse Count 在所选时间间隔内,硬解析和软解析的次数。 总和 数量
Storage Allocated 采集时分配给数据库的总存储空间。 最大值 GB
Storage Allocated By Tablespace 采集时分配给表空间的总存储空间。 最大值 GB
Storage Used 采集时数据库已使用的总存储空间,包括表空间、闪回恢复区、控制文件和日志文件所占用的空间。 最大值 GB
Storage Used By Tablespace 采集时表空间已使用的总存储空间。 最大值 GB
Storage Utilization 当前已使用的已配置存储容量百分比。 平均值 百分比
Storage Utilization By Tablespace 采集时表空间存储空间的使用百分比。 平均值 百分比
Transaction Count 在所选时间间隔内,用户提交和用户回滚的总次数。 总和 数量
User Calls 在所选时间间隔内,登录、解析和执行调用的总次数。 总和 数量

可插拔数据库监视器支持的完整管理指标

指标名称 描述 统计方式 单位
Allocated Storage Utilization By Tablespace 表空间已使用空间占已分配空间的百分比。 平均值 百分比
CPU Time 在时间间隔内,数据库实例中前台会话累积 CPU 时间的平均速率。 平均值 秒/秒
DB Time 在时间间隔内,数据库实例中前台会话累积数据库时间(CPU + 等待)的平均速率。 平均值 秒/秒
IOPS 每秒平均 IO 操作次数。 平均值 操作次数/秒
IO Throughput 每秒平均吞吐量(MB)。 平均值 MB/秒
Logical Blocks Read 每秒从 SGA/内存(缓冲区缓存)中读取的平均块数。 平均值 读取次数/秒
Max Tablespace Size 表空间的最大可能大小。 最大值 GB
Memory Usage 内存池的总大小。 平均值 MB
Monitoring User Password Expiration 监控用户密码到期前的剩余天数。 最新值 数量
Parses By Type 每秒硬解析或软解析次数。 平均值 解析次数/秒
Redo Size 生成的平均 redo 量。 平均值 MB/秒
Sessions 数据库中的会话数量。 平均值 数量
Transactions By Status 每秒已提交或已回滚的事务数量。 平均值 事务次数/秒
Unusable Indexes 数据库 Schema 中不可用索引的数量。 最大值 数量
Wait Time 在时间间隔内,数据库实例中前台会话累积非空闲等待时间的平均速率。 平均值 秒/秒

阈值配置

为 Base Database 监视器配置阈值:

  1. 登录 Site24x7,依次导航至管理 > 配置文件 > 阈值与可用性
  2. 点击添加阈值配置文件
  3. 监视器类型下拉菜单中选择 Base Database,并在显示名称字段中填写适当名称。
  4. 支持的指标将显示在阈值配置部分。您可以为上述所有指标设置阈值。
  5. 点击保存

OCI Base Database 监视器的状态传播

Site24x7 的 OCI Base Database 集成支持跨数据库组件的状态传播

启用状态传播后:

  • 子监视器(如数据库和可插拔数据库)的告警默认处于禁用状态。
  • 来自子监视器的状态变更告警将被抑制,除非在编辑阈值页面中将跳过告警设置为
  • 父 Base Database 监视器将触发单个告警。

这将减少各数据库层级的告警噪声。

说明

支持状态传播的子监视器的告警将自动禁用。

例如,当某个可插拔数据库发生问题时,父 Base Database 监视器将触发单个告警,说明数据库存在问题。

预测

使用预测功能对上述所有支持指标的未来值进行估算。根据历史观测数据预测性能指标(即资源使用量的度量)的未来走势,从而做出明智决策。

授权许可

每个 Base Database、数据库和可插拔数据库监视器各消耗一个基础监视器许可证

查看 Base Database 数据

如需监控您的 Base Database Service 环境,请登录 Site24x7 账户,依次导航至 > OCI > Base Database

监视器数据

Base Database

Base Database 监视器的监视器数据如下。

摘要

摘要标签页以图表形式提供事件时间线和指标概览。

节点

节点标签页列出与 Base Database 监视器关联的所有节点。您可以查看节点名称、当前可用性状态、公有和私有 IP 地址以及故障域,以了解冗余的可用区分配。

数据库

数据库标签页显示所有数据库子监视器的列表。如需查看 Base Database 监视器的详细信息,请点击所需的监视器名称超链接。您可以深入查看各数据库,了解会话数、开放模式、内存使用率和可用性等性能指标。

工作请求

工作请求标签页显示在 Base Database Service 上发起的所有近期维护或管理操作(如扩容、备份、打补丁等)。这对于追踪配置变更和理解与维护活动相关的性能波动至关重要。

配置

配置标签页中,查看有关 Base Database 监视器的基本配置信息,如创建时间生命周期状态可用性域

Zia 预测

Zia 预测标签页中,获取基于历史时间序列数据展示性能指标(资源使用量的度量)未来走势的预测图表。系统使用 30 天的历史数据预测未来 30 天的指标使用情况。

中断

中断标签页提供中断的开始时间、结束时间、持续时长和备注(如有)等详情。

清单

清单标签页中,获取 Base Database ID区域监视器授权类别等详情。在此标签页中,可根据用户设置并查看阈值与可用性配置文件通知配置文件

日志报表

日志报表标签页提供 Base Database 监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

告警日志标签页显示为 Base Database 监视器触发的所有告警事件列表,包括阈值突破、宕机告警和恢复通知,以及对应的时间戳和严重级别。

数据库

数据库监视器的监视器数据如下。

摘要

摘要标签页以图表形式提供事件时间线和指标概览。

可插拔数据库

可插拔数据库标签页显示所有可插拔数据库子监视器的列表。如需查看 PDB 监视器的详细信息,请点击所需的监视器名称超链接。您可以深入查看各数据库,了解会话数、开放模式、内存使用率和可用性等性能指标。

工作请求

工作请求标签页显示在数据库监视器上发起的所有近期维护或管理操作(如扩容、备份、打补丁等)。这对于追踪配置变更和理解与维护活动相关的性能波动至关重要。点击所需的操作超链接可查看日志消息。

配置

配置标签页中,查看有关数据库监视器的基本配置信息,如生命周期状态数据库名称数据库版本

中断

中断标签页提供中断的开始时间、结束时间、持续时长和备注(如有)等详情。

清单

清单标签页中,获取数据库 ID区域监视器授权类别等详情。在此标签页中,可根据用户设置并查看阈值与可用性配置文件通知配置文件

日志报表

日志报表标签页提供数据库监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

告警日志标签页显示为 Base Database 监视器触发的所有告警事件列表,包括阈值突破、宕机告警和恢复通知,以及对应的时间戳和严重级别。

可插拔数据库

可插拔数据库监视器的监视器数据如下。

摘要

摘要标签页以图表形式提供事件时间线和指标概览。

工作请求

工作请求标签页显示在 PDB 监视器上发起的所有近期维护或管理操作(如扩容、备份、打补丁等)。这对于追踪配置变更和理解与维护活动相关的性能波动至关重要。点击所需的操作超链接可查看日志消息。

配置详情

配置详情标签页中,查看有关 PDB 监视器的基本配置信息,如显示名称生命周期状态OCID创建时间

Zia 预测

Zia 预测标签页中,获取基于历史时间序列数据展示性能指标(资源使用量的度量)未来走势的预测图表。系统使用 30 天的历史数据预测未来 30 天的指标使用情况。

中断

中断标签页提供中断的开始时间、结束时间、持续时长和备注(如有)等详情。

清单

清单标签页中,获取数据库 ID区域监视器授权类别等详情。在此标签页中,可根据用户设置并查看阈值与可用性配置文件通知配置文件

日志报表

日志报表标签页提供 PDB 监视器日志状态的汇总报表,可下载为 CSV 文件。

告警日志

告警日志标签页显示为 PDB 监视器触发的所有告警事件列表,包括阈值突破、宕机告警和恢复通知,以及对应的时间戳和严重级别。

本文档对您有帮助吗?

您愿意帮助我们改进文档吗?请告诉我们哪些方面可以做得更好。


很抱歉本文档未能让您满意。我们希望了解可以从哪些方面改进您的体验。


感谢您抽出时间分享反馈。我们将利用您的反馈来改进在线帮助资源。

短链接已复制!