<div dir="ltr">Hi All,<div><br></div><div>As part of our testing of failovers, we yank the network cable on a machine (to simulate a switch going down).  When we plug it back in, RabbitMQ goes into the network partition mode.  At first we were using the default (&#39;ignore&#39;) option for dealing with partitions, but it caused problems.</div>
<div><br></div><div>After that we put the nodes into &#39;autoheal&#39; mode.  This did not improve things.  Not only did the minority node not rejoin the partition, but it refused to restart without manually killing the process.  It also caused problems on the other nodes (in the majority).  They stopped accepting connections and I couldn&#39;t even log into the web UI.  So clearly, &#39;autoheal&#39; didn&#39;t seem to work as intended.</div>
<div><br></div><div>We&#39;re using RabbitMQ 3.1.1.  Is there anything fixed since then that might help with our situation?  Our end goal is to have everything working again without intervention.  I understand that this could cause *some* data loss during the autoheal process, but this is probably OK.  We&#39;d love just to get all three nodes happy again without having to manually restart any nodes.</div>
<div><br></div><div>Thanks,</div><div>Chris</div></div>