<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><div dir="ltr">Hello,<div><br></div><div>(mpich 3.2)</div><div><br></div><div>I have a scenario when i add a few extra processes do existing intercom.</div><div><br></div><div>it works as a simple loop -- </div><div>(1) n processes accept on n-intercom</div><div>(2) 1 process connects </div><div>(3) intracom is merged into n+1 intercom, intracom and n-intercom are closed</div><div>(4) repeat 1-3 as needed.</div><div><br></div><div>Occasionally, i observe that step 3 spuriously locks up (once i get in the range of 100+ processes). From what i can tell, all processes in step 3 are accounted for, and are waiting on the merge, but nothing happens. the collective barrier locks up.</div><div><br></div><div>I really have trouble resolving this issue, any ideas are appreciated!</div><div><br></div><div>Thank you very much.</div><div>-Dmitriy<br><div class="gmail_extra"><br><div class="gmail_quote"><br></div></div></div></div>