<div dir="ltr"><div>RABBITMQ 3.2.1 on Windows Server 2003</div><div><br></div><div><br></div>Came into work this morning to find a suspected Network partition on a 3 node cluster<div><br></div><div>Node 3 and Node 2 said Node 1 was down</div>
<div><br></div><div>Node 1 said 2 and 3 were down</div><div><br></div><div>Tried stop_app on Node 1 but it hung stop_app on Nodes 2 and 3 were fine.</div><div><br></div><div>All 3 nodes hang on start_app</div><div><br></div>
<div>Tried restarting Windows service. Nodes 2 and 3 come back and are clustered</div><div><br></div><div>Node 1 will not start. In the end I removed all contents of the db directory. Not it starts up.</div><div><br></div>
<div>I want to rejoin the cluster but it says it is already a member although cluster_status says otherwise.</div><div><br></div><div>I have tried forget_cluster_node from one of the running nodes but that hangs</div><div>
<br></div><div>Anyone any ideas?</div><div><br></div><div><br></div><div>Thanks</div><div><br></div><div><br></div><div><br clear="all"><div><br></div>-- <br>Patrick Long - Munkiisoft Ltd
</div></div>