<div dir="ltr">Yes I can see the point about statelessness.<div><br></div><div>It seems to me that in a messaging fabric, it is generally useful to have ways of dampening duplicates.</div><div><br></div><div>It occurred to me this morning that federation uses hop counts - in some topologies, esp. with planned redundancy, this does not work so well, and perhaps a feature like this would help.</div>
<div><br></div><div>Michael</div><div><br></div><div><br></div><div><br></div><div><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Nov 12, 2013 at 4:48 AM, Simon MacMullen <span dir="ltr">&lt;<a href="mailto:simon@rabbitmq.com" target="_blank">simon@rabbitmq.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">The trouble is, exchanges are meant to be stateless. So it&#39;s possible to introduce some state into an exchange, but we have to choose between having per-node state (in which case dedup only works per-node), or having cluster-global state (where we either funnel all messages through one node in the cluster before they get routed to queues, or distribute the state around the cluster, making updates into expensive 2PC).<br>

<br>
So this is doable but it&#39;s not obvious where compromises should be made. And as Matthias sort of pointed out, duplication can still happen due to redelivery, so this has to be an optimisation rather than something that guarantees duplicates won&#39;t happen.<br>

<br>
Having said all that, it wouldn&#39;t be hideously difficult to implement, so I might give it a go. Depends on whether anybody else would find such a feature useful...<br>
<br>
Cheers, Simon<div class="im"><br>
<br>
On 11/11/2013 19:28, Laing, Michael wrote:<br>
</div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">
Yes - that&#39;s actually what we do currently, using Cassandra, and it<br>
scales well.<br>
<br>
And we also do it in memory, at the retail level, and it is very fast as<br>
well.<br>
<br>
I am just trying to shave a millisecond off at the retail level.<br>
<br>
Cheers,<br>
<br>
Michael<br>
<br>
<br>
On Mon, Nov 11, 2013 at 2:22 PM, Matthias Reik &lt;<a href="mailto:maze@reik.se" target="_blank">maze@reik.se</a><br></div><div><div class="h5">
&lt;mailto:<a href="mailto:maze@reik.se" target="_blank">maze@reik.se</a>&gt;&gt; wrote:<br>
<br>
    Even though it sounds like a nice feature, it is probably difficult<br>
    to really implement, if not done on the client side. The duplicates<br>
    might happen when delivering to the client side. but on the client<br>
    side it should be quite easy to do the filtering:<br>
    * get a message from the queue,<br>
    * check against memcached (couchbase, or some other cache<br>
    technology) whether the messageID exists.<br>
    * Add the new message to memcached (can be done with the previous step)<br>
    * Set the timeout in memcached to your window size.<br>
<br>
    This should be straight forward, would scale up to quite a lot of<br>
    messages) and should remove (depending on your window size) all<br>
    duplicates.<br>
<br>
    Is there a good reason why you wouldn&#39;t want to do this on the<br>
    client side as described?<br>
<br>
    Cheers<br>
    Matthias<br>
<br>
    PS: as a caching technology you could of course do your own<br>
    in-memory-solution but that&#39;s probably more work than to use an<br>
    out-of-the-box solution.<br>
<br>
<br>
    On 2013-11-11 12:35 , Laing, Michael wrote:<br>
</div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="h5">
    In our scenarios, messages are ultimately delivered to a &#39;retail&#39;<br>
    rabbitmq instance to be delivered to a client. The pipelines that<br>
    process and deliver messages are purposefully redundant, hence<br>
    there may be multiple replicas of each message &#39;racing&#39; to the<br>
    endpoint.<br>
<br>
    Usually, the replicas are resolved before getting to the retail<br>
    rabbit. When components fail, however, duplicates can leak through<br>
    during a small window of time. We eliminate those duplicates at<br>
    the retail layer by looking at each message_id. Ultimately, our<br>
    client contract allows duplicates as well in case one slips by.<br>
<br>
    It seems to me that this is a generic issue.<br>
<br>
    What would be useful in our case, and hopefully for many others,<br>
    would be a &#39;Duplicate Message ID Window&#39; in milliseconds, as an<br>
    exchange attribute.<br>
<br>
    If non-zero, the exchange would drop any message with a duplicate<br>
    message_id that appeared within the specified window of time,<br>
    possibly routing it to the alternate exchange, if set.<br>
<br>
    In our case, a window of a few seconds, perhaps up to a minute<br>
    would suffice.<br>
<br>
    Thanks,<br>
<br>
    Michael<br>
<br>
<br>
<br>
    ______________________________<u></u>_________________<br>
    rabbitmq-discuss mailing list<br></div></div>
    <a href="mailto:rabbitmq-discuss@lists.rabbitmq.com" target="_blank">rabbitmq-discuss@lists.<u></u>rabbitmq.com</a>  &lt;mailto:<a href="mailto:rabbitmq-discuss@lists.rabbitmq.com" target="_blank">rabbitmq-discuss@<u></u>lists.rabbitmq.com</a>&gt;<br>

    <a href="https://lists.rabbitmq.com/cgi-bin/mailman/listinfo/rabbitmq-discuss" target="_blank">https://lists.rabbitmq.com/<u></u>cgi-bin/mailman/listinfo/<u></u>rabbitmq-discuss</a><br>
</blockquote><div class="im">
<br>
<br>
    ______________________________<u></u>_________________<br>
    rabbitmq-discuss mailing list<br>
    <a href="mailto:rabbitmq-discuss@lists.rabbitmq.com" target="_blank">rabbitmq-discuss@lists.<u></u>rabbitmq.com</a><br></div>
    &lt;mailto:<a href="mailto:rabbitmq-discuss@lists.rabbitmq.com" target="_blank">rabbitmq-discuss@<u></u>lists.rabbitmq.com</a>&gt;<div class="im"><br>
    <a href="https://lists.rabbitmq.com/cgi-bin/mailman/listinfo/rabbitmq-discuss" target="_blank">https://lists.rabbitmq.com/<u></u>cgi-bin/mailman/listinfo/<u></u>rabbitmq-discuss</a><br>
<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
rabbitmq-discuss mailing list<br>
<a href="mailto:rabbitmq-discuss@lists.rabbitmq.com" target="_blank">rabbitmq-discuss@lists.<u></u>rabbitmq.com</a><br>
<a href="https://lists.rabbitmq.com/cgi-bin/mailman/listinfo/rabbitmq-discuss" target="_blank">https://lists.rabbitmq.com/<u></u>cgi-bin/mailman/listinfo/<u></u>rabbitmq-discuss</a><br>
<br>
</div></blockquote>
<br>
</blockquote></div><br></div>