<div dir="ltr">Hi MPICH,<div>I have a small program which has different outputs on MPICH 3.1 & MPICH 3.4.2<br></div><div>The program (code attached):</div><div><ol><li>Master executes ping-pong with each one of the slaves (separately)</li><li>Each slave replies to master when it gets a message from master</li><li>One of the slaves simulates failre with command abort().</li><li>Master recognizes that slave fails and continues to work with survived slaves only.</li></ol><div><u>I execute my program on ubuntu18.</u><br></div></div><div>I use TCP as a transport layer.<br></div><div><u>Execute command</u>: </div><div>mpiexec.hydra -genvall -disable-auto-cleanup -f MpiConfigMachines.txt -launcher=ssh -n 3 ft_ping_pong<br></div><div><br></div><div><div><div>I expect that "ping pong" will continue till all 20 iterations will finish.</div></div><div>MPICH 3.1    hydra works as expected only slave 1 fails and ping-pong continues between Master and slave2.</div><div>MPICH 3.4.2 hydra process slave 2 fails together with slave 1.</div><div><br></div></div><div><u>MPICH 3.1 configuration:</u></div><div>./configure --prefix="my directory" --enable-error-checking=runtime --enable-g=dbg CFLAGS=-fPIC CXXFLAGS=-fPIC FFLAGS=-fpic --enable-threads=runtime --enable-totalview --enable-static --disable-f77 --disable-fc<br></div><div><br></div><div><u>MPICH 3.4.2 configuration:</u></div><div>$ ./configure --prefix="my directory" --enable-error-checking=all --enable-g=dbg CFLAGS=-fPIC CXXFLAGS=-fPIC FFLAGS=-fpic --enable-threads=runtime --enable-totalview --enable-static --disable-f77 --disable-fc --disable-fortran <b>--with-device=ch3:nemesis</b> --enable-error-messages=all<br></div><div><br></div><div>Should I use another device or the behavior was modified between versions?<br></div><div><br></div><div>Regards,</div><div>Anatoly.</div><div><br></div><div><br></div><div><br></div></div>