原 Greenplum中检测和恢复故障的master实例(gpinitstandby命令)

发布日期 2023年1月28日 · 已更新 2024年4月7日

0 261 2

Tags：原创故障处理 GreenPlum 高可用检测和恢复 gpactivatestandby master gpinitstandby

👉 本文共约1516个字，系统预计阅读时间或需6分钟。

简介
master状态检测
Greenplum中切换故障的Master命令gpactivatestandby
master恢复示例
正常集群状态
故障情况1：master 服务器故障
关闭master节点
激活standby节点
修复mdw1节点，然后指定为新的standby节点
故障情况2：standby 服务器故障
情况1：能正常启动
情况2：数据库文件损坏不能正常启动
总结
参考

简介

greenplum整个集群是由多台服务器组合而成，任何一台服务都有可能发生软件或硬件故障，我们一起来模拟一下任何一个节点或服务器故障后，greenplumn的容错及恢复方法.

本文主要说明master或standby master故障后的处理办法。

master状态检测

使用gpstate -f或查询select * from gp_segment_configuration order by 2,1;即可。

Greenplum中切换故障的Master命令gpactivatestandby

https://www.dbaup.com/greenplumzhonghuifuguzhangdemasterminglinggpactivatestandby.html

master恢复示例

环境说明：https://www.dbaup.com/mppjiagouzhigreenplumdeanzhuangpeizhigaojiban.html#huan_jing_shen_qing

正常集群状态

在master查看数据库当前的状态：


[gpadmin@mdw1 ~]$ gpstate
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-Starting gpstate with args: 
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-local Greenplum Version: 'postgres (Greenplum Database) 6.23.0 build commit:5b5e432f35f92a40c18dffe4e5bca94790aae83c Open Source'
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-master Greenplum Version: 'PostgreSQL 9.4.26 (Greenplum Database 6.23.0 build commit:5b5e432f35f92a40c18dffe4e5bca94790aae83c Open Source) on x86_64-unknown-linux-gnu, compiled by gcc (GCC) 6.4.0, 64-bit compiled on Dec 20 2022 08:02:23'
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-Obtaining Segment details from master...
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-Gathering data from segments...
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-Greenplum instance status summary
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Master instance                                           = Active
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Master standby                                            = mdw2
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Standby master state                                      = Standby host passive
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total segment instance count from metadata                = 32
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Primary Segment Status
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total primary segments                                    = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total primary segment valid (at master)                   = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total primary segment failures (at master)                = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of postmaster.pid files missing              = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of postmaster.pid files found                = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of postmaster.pid PIDs missing               = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of postmaster.pid PIDs found                 = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of /tmp lock files missing                   = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of /tmp lock files found                     = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number postmaster processes missing                 = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number postmaster processes found                   = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Mirror Segment Status
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total mirror segments                                     = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total mirror segment valid (at master)                    = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total mirror segment failures (at master)                 = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of postmaster.pid files missing              = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of postmaster.pid files found                = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of postmaster.pid PIDs missing               = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of postmaster.pid PIDs found                 = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of /tmp lock files missing                   = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number of /tmp lock files found                     = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number postmaster processes missing                 = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number postmaster processes found                   = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number mirror segments acting as primary segments   = 0
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-   Total number mirror segments acting as mirror segments    = 16
20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------

[gpadmin@mdw1 ~]$ gpstate

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-Starting gpstate with args:

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-local Greenplum Version: 'postgres (Greenplum Database) 6.23.0 build commit:5b5e432f35f92a40c18dffe4e5bca94790aae83c Open Source'

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-master Greenplum Version: 'PostgreSQL 9.4.26 (Greenplum Database 6.23.0 build commit:5b5e432f35f92a40c18dffe4e5bca94790aae83c Open Source) on x86_64-unknown-linux-gnu, compiled by gcc (GCC) 6.4.0, 64-bit compiled on Dec 20 2022 08:02:23'

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-Obtaining Segment details from master...

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-Gathering data from segments...

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-Greenplum instance status summary

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Master instance = Active

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Master standby = mdw2

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Standby master state = Standby host passive

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total segment instance count from metadata = 32

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Primary Segment Status

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total primary segments = 16

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total primary segment valid (at master) = 16

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total primary segment failures (at master) = 0

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total number of postmaster.pid files missing = 0

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total number of postmaster.pid files found = 16

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total number of postmaster.pid PIDs missing = 0

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total number of postmaster.pid PIDs found = 16

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total number of /tmp lock files missing = 0

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total number of /tmp lock files found = 16

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total number postmaster processes missing = 0

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total number postmaster processes found = 16

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Mirror Segment Status

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:-----------------------------------------------------

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total mirror segments = 16

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total mirror segment valid (at master) = 16

20230131:16:37:05:021525 gpstate:mdw1:gpadmin-[INFO]:- Total mirror segment failures (at master) = 0