<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><div dir="ltr">Dear All,<div><br></div><div>In one of our application I am seeing following error while using collective call MPI_File_write_all :</div><div><br></div><div><div><font color="#0000ff">Error in ADIOI_Calc_aggregator(): rank_index(1) >= fd->hints->cb_nodes (1) fd_size=102486061 off=102486469<br></font></div></div><div><br></div><div>Non collective version works fine.</div><div><br></div><div>While looking at callstack I came across below comment in mpich-3.2/src/mpi/romio/adio/common/ad_aggregate.c :</div><div><br></div><div><div><font color="#0000ff">    /* we index into fd_end with rank_index, and fd_end was allocated to be no</font></div><div><font color="#0000ff">     * bigger than fd->hins->cb_nodes.   If we ever violate that, we're</font></div><div><font color="#0000ff">     <b>* overrunning arrays.  Obviously, we should never ever hit this abort */</b></font></div><div><font color="#0000ff">    if (rank_index >= fd->hints->cb_nodes || rank_index < 0) {</font></div><div><font color="#0000ff">        FPRINTF(stderr, "Error in ADIOI_Calc_aggregator(): rank_index(%d) >= fd->hints->cb_nodes (%d) fd_size=%lld   off=%lld\n",</font></div><div><font color="#0000ff">            rank_index,fd->hints->cb_nodes,fd_size,off);</font></div><div><font color="#0000ff">        MPI_Abort(MPI_COMM_WORLD, 1);</font></div><div><font color="#0000ff">    }</font></div></div><div><br></div><div>I am going to look into application and see if there is an issue with offset overflow. But looking at above comment <font color="#000000">("Obviously, we should never ever hit this abort ")</font> I thought should ask if there is any obvious thing I am missing. </div><div><br></div><div>Regards,</div><div>Pramod</div><div><br></div><div>p.s. I will provide reproducer after looking into this more carefully.</div></div>