<html><head><meta http-equiv="Content-Type" content="text/html charset=windows-1252"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">Hi Michael,<div><br></div><div>Thanks very much for your response.  I have a bit more data about this that could be interesting.</div><div><br></div><div>Our producer node dysfunction seems to be correlated with a heartbeat timeout event:</div><div><br></div><div><div>5/7/14 12:44:11.000 AM<span class="Apple-tab-span" style="white-space:pre"> </span></div><div>=INFO REPORT==== 7-May-2014::00:44:11 ===</div><div>accepting AMQP connection <0.17458.855> (172.20.153.34:36684 -> 172.20.153.185:5672)</div><div><br></div><div><br></div><div>5/7/14 12:44:11.000 AM<span class="Apple-tab-span" style="white-space:pre"> </span></div><div>=ERROR REPORT==== 7-May-2014::00:44:11 ===</div><div>closing AMQP connection <0.30506.852> (172.20.153.34:37769 -> 172.20.153.185:5672):</div><div>{heartbeat_timeout,running}</div><div><br></div><div><br></div><div>If we check netstat on the producer / rabbit-server sides, we see a very large Send-Q value on the producer, and nothing on the rabbit-server side; the producer Send-Q size just continues to grow larger, with no response from the server:</div><div><br></div><div>producer:</div><div><div>[ccpmer-po-cb48-p ~ ]$ netstat -an | grep 5672</div><div>tcp        0 1066985 ::ffff:172.20.153.34:36684  ::ffff:172.20.153.185:5672  ESTABLISHED </div><div>tcp        1      0 ::ffff:172.20.153.34:60075  ::ffff:172.20.149.41:15672  CLOSE_WAIT  </div><div><br></div><div>rabbit side:</div><div>[ccpmer-po-cb176-p ~ ]$ netstat -an | grep 5672 | grep 34</div><div>tcp        0      0 ::ffff:172.20.153.185:5672  ::ffff:172.20.153.34:36684  ESTABLISHED </div><div><br></div><div>producer Send-Q keeps growing.</div><div>[ccpmer-po-cb48-p ~ ]$ netstat -an | grep 5672</div><div>tcp        0 1074230 ::ffff:172.20.153.34:36684  ::ffff:172.20.153.185:5672  ESTABLISHED </div><div>tcp        1      0 ::ffff:172.20.153.34:60075  ::ffff:172.20.149.41:15672  CLOSE_WAIT</div></div><div><br></div><div><br></div><div>Again we�re running the 3.2.2 version of the server - I do see that bugfix 25457 fixed a similar issue in the 3.0.3 release, but we�re past that now.</div><div><br></div><div>Is this still indicative of the socketWrite timeout issue you referred me to in your last response, or could this be something else?  Is there more data you�d like to see that could help diagnose this further?</div><div><br></div><div>Are there any plans to fix <a href="https://github.com/rabbitmq/rabbitmq-java-client/issues/11">https://github.com/rabbitmq/rabbitmq-java-client/issues/11</a> soon?  There�s not another more recent version of rabbit we could upgrade to that would help us, is there?  </div><div><br></div><div>Thanks again,</div><div><br></div><div>Jeff</div><div><br></div><div><br></div><div><br></div><div><div>On Apr 28, 2014, at 6:31 PM, Michael Klishin <<a href="mailto:mklishin@gopivotal.com">mklishin@gopivotal.com</a>> wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">On 29 April 2014 at 02:29:30, Jeff Doto (<a href="mailto:jeffdoto@gmail.com">jeffdoto@gmail.com</a>) wrote:<br><blockquote type="cite"><blockquote type="cite">We�re wondering if anyone has encountered an issue similar  <br></blockquote>to this running the versions of Rabbit server / client we are.  <br>Are there any suggestions for what we can do to prevent this? Could  <br>upgrading the server version help?<br></blockquote><br>This is a known Java client (or, well, JDK Socket) limitation:<br><a href="http://markmail.org/thread/w7ay4hslxwqirfsc">http://markmail.org/thread/w7ay4hslxwqirfsc</a> <br>--  <br>MK  <br><br>Software Engineer, Pivotal/RabbitMQ<br></blockquote></div><br></div></body></html>