记ADG备库日志应用延迟的一次故障处理-云和恩墨技术通讯精选

HarmonyOS

  原文:https://www.enmotech.com/web/detail/1/773/1.html (复制链接,打开浏览器即可查看)

  各位亲爱的用户/读者朋友们:

  为了及时共享行业案例,通告共性问题,达成知识共享和提前预防,我们整理和编辑了《云和恩墨技术通讯》(7月刊),通过对过去一段时间的知识回顾和故障归纳,以期提供有价值的信息供大家参考。

  同时,我们也希望能够将热点事件、新的产品特性及其他有价值的信息聚集起来,为您提供具有前瞻性的信息,保持对于当前最新的数据库新闻和事件的了解,其中包括重要数据库产品发布、警报、更新、新版本、补丁等。

  本期目录:

  新闻:2022年7月份数据库流行度排行榜警示:Oracle 12.1 因 bug 触发 ORA-600警示:PGA 超过 4GB 时触发 BUG 导致 ORA-4030频发:记ADG备库日志应用延迟的一次故障处理经验:如何应对DNS服务器异常导致监听故障经验:Linux大内存下未设置大页引发故障问题:开启Audit审计偶遇buffer busy waits异常等待问题:主机内存太大致redo buffer size超过redo file size继而引发大量log file switch公告:墨天轮DBASK技术专家邀请函抢先下载:https://cs.enmotech.com/docDownload/2988(复制链接浏览器中打开,或者点击“阅读原文”)

  往期技术通讯下载链接:

  https://cs.enmotech.com/docDownload?tag=enmo_techrelease

  部分精选-频发:记ADG备库日志应用延迟的一次故障处理-卢立广

  


Oracle ADG(Active Data Guard)实现了主备数据库之间的数据实时同步传输,但是如果备库 standby redo log 组数配置过少,在业务高峰期时刻,主库日志切换频繁,备库日志来不及应用, 便会导致短期内暂无空闲的standby redo log接收主库传输过来的日志,从而引发数据延迟,增 加潜在的数据安全风险。近期,我们再次收到几个核心生产系统的故障案例, 特此再次提醒大家,防范此问题发生。

  问题描述

  某客户数据库的DG备库出现间歇性的日志应用延迟,具体表现为备库apply lag延迟过高。影响到数据库的实时同步传输,增加潜在的数据安全风险。

  检查该备库的参数配置,发现备库参数均符合标准规范。

  检查备库日志应用状态,MRP0状态为applying状态,表明备库正在做日志应用。

  检查DG告警提示,发现无error项,且状态为valid,说明无传输性异常。

  问题分析

  由于DG相关的参数配置和进程均正常,无报错信息,检查主库的日志产生量,发现主库日志在一定时间内产生了较多的归档量,说明主库业务发生了变化。

  检查主库的alert告警日志,以2022年5月29日下午3点到4点的日志为例,伴随着业务量的提升,主库产生的归档量增加,这也就意味着备库需要传输和应用的归档也会同步增加,通过alert日志可以看到,在业务高峰期,备库所有standby redo 都处于active状态,无法接收thread 1的日志,因此造成了日志的应用延迟。

  问题解决

  当前备库standby redo log比主库多1组,建议增加备库standby redo log 组数,防止在业务高峰期 时刻备库没有空闲的standbyredo log接收主库传输过来的日志,引发数据延迟。

  扩展阅读

  《云和恩墨技术通讯》(3月刊)

  《云和恩墨技术通讯》(4月刊)

  《云和恩墨技术通讯》(5月刊)

  《云和恩墨技术通讯》(6月刊)

  往期技术通讯下载链接:

  https://cs.enmotech.com/docDownload?tag=enmo_techreleasehttps://cs.enmotech.com/docDownload?tag=enmo_techrelease

  文章转载自 有赞coder , 作者 有赞技术

  想了解更多关于数据库、云技术的内容吗?

  快来“数据和云”、“云和恩墨”官方网站,我们期待与大家一同学习和进步!

  (扫描上方,“数据和云”,即可查看更多科技文章)

标签: HarmonyOS