<div dir="ltr">Hi All,<div><br></div><div>As part of our testing of failovers, we yank the network cable on a machine (to simulate a switch going down). �When we plug it back in, RabbitMQ goes into the network partition mode. �At first we were using the default (&#39;ignore&#39;) option for dealing with partitions, but it caused problems.</div>
<div><br></div><div>After that we put the nodes into &#39;autoheal&#39; mode. �This did not improve things. �Not only did the minority node not rejoin the partition, but it refused to restart without manually killing the process. �It also caused problems on the other nodes (in the majority). �They stopped accepting connections and I couldn&#39;t even log into the web UI. �So clearly, &#39;autoheal&#39; didn&#39;t seem to work as intended.</div>
<div><br></div><div>We&#39;re using RabbitMQ 3.1.1. �Is there anything fixed since then that might help with our situation? �Our end goal is to have everything working again without intervention. �I understand that this could cause *some* data loss during the autoheal process, but this is probably OK. �We&#39;d love just to get all three nodes happy again without having to manually restart any nodes.</div>
<div><br></div><div>Thanks,</div><div>Chris</div></div>