We have a <span class="il">3</span> node cluster (mq1, mq2, mq3) running <span class="il">2.8</span>.4
 supporting a small number of HA queues. During startup of the cluster, we start all nodes in parallel. Usually everything works fine. However, we&#39;ve just recently seen one of the nodes (mq3) won&#39;t start, i.e., the rabbitmqctl wait &lt;pid&gt; doesn&#39;t complete.<br>
<br>I can log in to the management UI on mq1 and mq2, so they&#39;re at least minimally running.<br><br>Luckily, we&#39;ve turned on verbose Mnesia logging. here&#39;s what the failing node (mq3) shows in the console spew:<br>
<br>Activating RabbitMQ plugins ...<br>6 plugins activated:<br>* amqp_client-0.0.0<br>* mochiweb-1.3-rmq0.0.0-git<br>* rabbitmq_management-0.0.0<br>* rabbitmq_management_agent-0.0.0<br>* rabbitmq_mochiweb-0.0.0<br>* webmachine-1.7.0-rmq0.0.0-hg<br>
Mnesia(rabbit@mq3): mnesia_monitor starting: &lt;0.54.0&gt;<br>Mnesia(rabbit@mq3): Version: &quot;4.4.12&quot;<br>Mnesia(rabbit@mq3): Env access_module: mnesia<br>Mnesia(rabbit@mq3): Env dir: &quot;/highland/var/lib/rabbit@mq3&quot;<br>
Mnesia(rabbit@mq3): Env dump_log_load_regulation: false<br>Mnesia(rabbit@mq3): Env dump_log_time_threshold: 180000<br>Mnesia(rabbit@mq3): Env dump_log_update_in_place: true<br>Mnesia(rabbit@mq3): Env dump_log_write_threshold: 1000<br>
Mnesia(rabbit@mq3): Env event_module: mnesia_event<br>Mnesia(rabbit@mq3): Env core_dir: false<br>Mnesia(rabbit@mq3): Env no_table_loaders: 2<br>Mnesia(rabbit@mq3): Env dc_dump_limit: 4<br>Mnesia(rabbit@mq3): Mnesia debug level set to trace<br>
Mnesia(rabbit@mq3): mnesia_subscr starting: &lt;0.55.0&gt;<br>Mnesia(rabbit@mq3): mnesia_locker starting: &lt;0.56.0&gt;<br>Mnesia(rabbit@mq3): mnesia_late_loader starting: &lt;0.86.0&gt;<br>Mnesia(rabbit@mq3): Cannot get cstructs, Node rabbit@mq2 {node_not_running,<br>
Mnesia(rabbit@mq3): Transaction log dump skipped (optional): schema_prepare<br>Mnesia(rabbit@mq3): Transaction log dump skipped (optional): schema_prepare<br>Mnesia(rabbit@mq3): mnesia_downs = []<br>������������������������������������������ {rabbit_exchange,ram_only},<br>
������������������������������������������ {rabbit_semi_durable_route,<br>������������������������������������������� ram_only},<br>������������������������������������������ {rabbit_listener,ram_only},<br>������������������������������������������ {gm_group,ram_only}]<br>
Mnesia(rabbit@mq3): Table rabbit_route is loaded on rabbit@mq1. s=ram_copies, r=nowhere, lc=false, f=false, m=true<br>Mnesia(rabbit@mq3): Getting table rabbit_user_permission (disc_copies) from node rabbit@mq1: {active_remote,<br>
�������������������������������������������������������������������������������������������� rabbit@mq1}<br>Mnesia(rabbit@mq3): Table rabbit_semi_durable_route is loaded on rabbit@mq1. s=ram_copies, r=nowhere, lc=false, f=false, m=true<br>
Mnesia(rabbit@mq3): Table rabbit_queue is loaded on rabbit@mq2. s=ram_copies, r=nowhere, lc=false, f=false, m=true<br>Mnesia(rabbit@mq3): Table rabbit_route is loaded on rabbit@mq2. s=ram_copies, r=nowhere, lc=false, f=false, m=true<br>
last message repeated 2 times<br>|�� +---+�� +-------+<br>|������������������ |<br>starting file handle cache server������������������������������������ ...done<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3657,&lt;0.181.0&gt;}: in 128ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3657,&lt;0.181.0&gt;}: in 236ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Sync serial {tid,3657,&lt;0.181.0&gt;}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3657,&lt;0.181.0&gt;}: in 488ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3657,&lt;0.181.0&gt;}: in 519ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
{aborted,nomore}<br>Mnesia(rabbit@mq3): Getting table rabbit_durable_exchange (disc_copies) from node rabbit@mq1: {active_remote,<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 115ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 111ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 168ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Sync serial {tid,3732,&lt;0.181.0&gt;}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 361ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 481ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 552ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 538ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 226ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 327ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 313ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 326ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3732,&lt;0.181.0&gt;}: in 763ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Transaction {tid,3732,&lt;0.181.0&gt;} calling #Fun&lt;mnesia_loader.0.79080158&gt; with [] failed: <br>{aborted,nomore}<br>Mnesia(rabbit@mq3): Getting table rabbit_durable_exchange (disc_copies) from node rabbit@mq2: {active_remote,<br>
��������������������������������������������������������������������������������������������� rabbit@mq1}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 8ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 34ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 54ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 80ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 180ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 85ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 201ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 167ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 385ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 315ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Sync serial {tid,3733,&lt;0.181.0&gt;}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 237ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 165ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 197ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 496ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 348ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 325ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 412ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 585ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3733,&lt;0.181.0&gt;}: in 365ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Transaction {tid,3733,&lt;0.181.0&gt;} calling #Fun&lt;mnesia_loader.0.79080158&gt; with [] failed: <br>
{aborted,nomore}<br>Mnesia(rabbit@mq3): Getting table rabbit_durable_exchange (disc_copies) from node rabbit@mq1: {active_remote,<br>��������������������������������������������������������������������������������������������� rabbit@mq1}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 7ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 21ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 34ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 74ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 89ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 125ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 241ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 249ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 195ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 317ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Sync serial {tid,3734,&lt;0.181.0&gt;}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 421ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 210ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 447ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 213ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 425ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 261ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 440ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 620ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>Mnesia(rabbit@mq3): Restarting transaction {tid,3734,&lt;0.181.0&gt;}: in 367ms {cyclic,rabbit@mq3,{schema,rabbit_durable_exchange},read,read,{tid,3654,&lt;0.175.0&gt;}}<br>
Mnesia(rabbit@mq3): Transaction {tid,3734,&lt;0.181.0&gt;} calling #Fun&lt;mnesia_loader.0.79080158&gt; with [] failed: <br>{aborted,nomore}<br><br>The pattern of &quot;Getting table rabbit_durable_exchange (disc_copies) from node rabbit@mq1:&quot; cycles between mq1 and mq2 repeatedly until I kill mq3.<br>
<br>What other sort of information can I provide or look for when this situation repeats?<br><br>Thanks,<br><br>Matt<br>