灾备升主failover异常

灾备升主failover错误信息参考

故障描述

原因和解决方案

灾备数据库实例有故障节点未参与灾备数据库实例升主。

原因:服务器宕机,网络中断等原因导致节点脱离灾备数据库实例,没有参与灾备数据库实例升主。

解决方案:

  1. 故障节点修复后重新加入数据库实例。
  2. 修改CMS和CMA中关于数据库实例灾备模式的参数,切回主数据库实例配置。
  3. gs_guc set -Z cmserver -N all -I all -c "backup_open = 0"
    gs_guc set -Z cmagent -N all -I all -c "agent_backup_open=0"
    gs_guc set -Z cmagent -N all -I all -c "disaster_recovery_type= 0"
  4. 接入故障节点,查询CMS和CMA的进程ID,使用kill -9命令杀掉进程,然后进程会被om_monitor重启,完成CMS和CMA参数修改的生效。
  5. 手动修复改节点后使用cm_ctl start-n NODEID -D DATADIR。