<tt><font size=2><br>
 I've had a hang reported on BG/Q after about 2K MPI_Comm_create's.  </font></tt>
<br>
<br><tt><font size=2> It hangs on the latest 2 releases (mpich2 v1.5.x
and v1.4.x) on BG/Q.</font></tt>
<br>
<br><tt><font size=2> It also hangs on linux: 64bit (MPI over PAMI)
MPICH2 library.</font></tt>
<br>
<br><tt><font size=2> On older mpich 1.? (BG/P) it failed with 'too
many communicators' and</font></tt>
<br><tt><font size=2> didn't hang, which is what they expected.</font></tt>
<br>
<br><tt><font size=2> It seems like it's stuck in the while (*context_id
== 0)  loop </font></tt>
<br><tt><font size=2> repeatedly calling allreduce and never settling
on a context id in </font></tt>
<br><tt><font size=2> commutil.c.  I didn't do a lot of debug
but seems like it's in </font></tt>
<br><tt><font size=2> vanilla mpich code, not something we modified.</font></tt>
<br>
<br><tt><font size=2> ftmain.f90 fails if you run it on >2k ranks
(creates one comm per <br>
 rank).  This was the original customer testcase.</font></tt>
<br><tt><font size=2> <br>
 ftmain2.f90 fails by looping so you can run on fewer ranks.</font></tt>
<br>
<br>
<br>
<br>
<br><tt><font size=2>I just noticed that with --np 1, I get the 'too many
communicators' from ftmain2.  But --np 2 and up hangs.</font></tt>
<br>
<br><tt><font size=2>stdout[0]:  check_newcomm do-start    
      0 , repeat         2045 , total
       2046</font></tt>
<br><tt><font size=2>stderr[0]: Abort(1) on node 0 (rank 0 in comm 1140850688):
Fatal error in PMPI_Comm_create: Other MPI error, error stack:</font></tt>
<br><tt><font size=2>stderr[0]: PMPI_Comm_create(609).........: MPI_Comm_create(MPI_COMM_WORLD,
group=0xc80700f6, new_comm=0x1dbfffb520) failed</font></tt>
<br><tt><font size=2>stderr[0]: PMPI_Comm_create(590).........: </font></tt>
<br><tt><font size=2>stderr[0]: MPIR_Comm_create_intra(250)...: </font></tt>
<br><tt><font size=2>stderr[0]: MPIR_Get_contextid(521).......: </font></tt>
<br><tt><font size=2>stderr[0]: MPIR_Get_contextid_sparse(752): Too many
communicators</font></tt>
<br>