<div>Hi Guys,</div>
<div> </div>
<div>I&#39;m digging into RabbitMQ, and would like to build in fault tollerance, scalability, and garbage collection within the cloud (highly asynchronous context).  Probably the solution should be message queue based, and heuristic based.  eg. I lost the connection, so self destruct.  The queue is filling up, so fire up more instances. Talk to AWS and conduct an audit on nodes sending in a heart beat. Destroy anything that does not respond.</div>

<div> </div>
<div>Would anyone care to share some experiences?  There have got to be a few papers out there on this.  I&#39;m hoping to get through this without rebuilding the operating system.  Given that RabbitMQ relies on Erlang, I&#39;m hoping to get some of this for free, and that new nodes can make lightweight considerations in code. </div>

<div> </div>
<div>thanks,</div>
<div>-Steven  </div>