<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><div dir="ltr">Hi Daniel,<div><br></div><div>Thanks for reporting the bug. I can reproduce it on my desktop. I will work on a fix. You can track the progress here.</div><div><br></div><div><a href="http://trac.mpich.org/projects/mpich/ticket/2269">http://trac.mpich.org/projects/mpich/ticket/2269</a><br></div><div><br></div><div class="gmail_extra"><div><div class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr">--</div><div dir="ltr">Huiwei Lu</div><div dir="ltr">Postdoc Appointee</div><div dir="ltr">Mathematics and Computer Science Division</div><div dir="ltr">Argonne National Laboratory</div><div dir="ltr"><a href="http://www.mcs.anl.gov/~huiweilu/" target="_blank">http://www.mcs.anl.gov/~huiweilu/</a></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote">On Tue, Jun 2, 2015 at 4:32 PM, Daniel Pou <span dir="ltr"><<a href="mailto:daniel.pou@gmail.com" target="_blank">daniel.pou@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Starting with the test comm_idup_mul.c, and increasing the value of NUM_ITER 10, I am seeing a<div>fairly regular hang with a build from latest master (commit 25204 5/31).</div><div><br></div><div>I am running with 2 ranks (1 per node) from SLURM (v2.6.5). I was able to see the behavior with </div><div><br></div><div>srun -N 2 -n 2 ./comm_idup_mul</div><div> (linking against SLURM PMI) and <br></div><div><br></div><div>salloc -N 2 -n 2 mpiexec ./comm_idup_mul.</div><div><br></div><div>I witnessed this with both the MXM and TCP netmods. I don't see any issues on single node runs.</div><div><br></div><div>Thank you,</div><div>-Dan</div><div><br></div><div>For reference:</div><div>Modified code from <a href="http://trac.mpich.org/projects/mpich/ticket/1935" target="_blank">http://trac.mpich.org/projects/mpich/ticket/1935</a></div><div><br></div><div><br></div><div><div>/* -*- Mode: C; c-basic-offset:4 ; indent-tabs-mode:nil ; -*- */</div><div>/*</div><div> *  *  (C) 2012 by Argonne National Laboratory.</div><div> *   *      See COPYRIGHT in top-level directory.</div><div> *    */</div><div><br></div><div>/*</div><div> *  * Test creating multiple communicators with MPI_Comm_idup.</div><div> *   */</div><div><br></div><div>#include <stdio.h></div><div>#include <mpi.h></div><div><br></div><div>#define NUM_ITER    10</div><div><br></div><div>int main(int argc, char **argv)</div><div>{</div><div>    int i, rank;</div><div>    MPI_Comm comms[NUM_ITER];</div><div>    MPI_Request req[NUM_ITER];</div><div><br></div><div>    MPI_Init(&argc, &argv);</div><div>    MPI_Comm_rank(MPI_COMM_WORLD, &rank);</div><div><br></div><div>    for (i = 0; i < NUM_ITER; i++)</div><div>        MPI_Comm_idup(MPI_COMM_WORLD, &comms[i], &req[i]);</div><div><br></div><div>    MPI_Waitall(NUM_ITER, req, MPI_STATUSES_IGNORE);</div><div><br></div><div>    for (i = 0; i < NUM_ITER; i++)</div><div>        MPI_Comm_free(&comms[i]);</div><div><br></div><div>    if (rank == 0)</div><div>        printf(" No Errors\n");</div><div><br></div><div>    MPI_Finalize();</div><div><br></div><div>    return 0;</div><div>}</div></div></div>
<br>_______________________________________________<br>
discuss mailing list     <a href="mailto:discuss@mpich.org">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br></blockquote></div><br></div></div>