<div dir="ltr">Hello Tony,<div>Thank you very much for your reply. I followed your advice and gave the hostname 'dragonfly' to my machine. Then, in /etc/hosts I provided gave the alias 'dragonfly' to localhost as you suggested:</div><div><br></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">"</span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">marto@dragonfly% cat /etc/hosts</span><br></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">::1                     localhost dragonfly
</span><br>127.0.0.1               localhost dragonfly<br></span></div><div><span style="font-family:monospace">"</span></div><div><br></div><div>I compiled both the icpi and hellow examples. Now mpiexec seems to work, although not as reliably as I might wish. Running any of the examples with one core like this:<br></div><div><br></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">mpiexec -n 1 mpich-3.0.4/examples/hellow</span><br></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)"><br></span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">is always successful. I could never get the command to finish with 2, 3, or 4 cores: it simply hangs. E.g. with 2 cores after running the above command I get:</span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)"><br></span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">"</span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">marto@dragonfly% ps x | grep hellow
</span><br>166493 ??  I6s      0:00.00 mpich-3.0.4/examples/hellow
<br>166494 ??  I6s      0:00.00 mpich-3.0.4/examples/hellow<br></span></div><div><span style="font-family:monospace">"</span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)"><br></span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">With 5, 6, 7, or 8 cores most of the time the command is successful, that is all cores print as expected, but sometimes the command also hangs just as with 2 cores.</span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">Testing with icpi and 10^10 intervals gives the following output with 1 core:</span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)"><br></span></span></div><div><span style="font-family:monospace">"</span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">marto@dragonfly% mpiexec -n 1 mpich-3.0.4/examples/icpi  </span><br>Enter the number of intervals: (0 quits) 10000000000
<br>pi is approximately 3.1415926535895782, Error is 0.0000000000002149
<br>wall clock time = 19.997830<br></span></div><div><span style="font-family:monospace">"</span></div><div><span style="font-family:monospace"><br></span></div><div><span style="font-family:monospace">and the following with 5 cores, when it does not hang:</span></div><div><span style="font-family:monospace"><br></span></div><div><span style="font-family:monospace">"</span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">marto@dragonfly% mpiexec -n 5 mpich-3.0.4/examples/icpi
</span><br>Enter the number of intervals: (0 quits) 10000000000
<br>pi is approximately 3.1415926535899605, Error is 0.0000000000001674
<br>wall clock time = 4.475224<br></span></div><div><span style="font-family:monospace">"</span></div><div><span style="font-family:monospace"><br></span></div><div><span style="font-family:monospace">As you can see, the calculation scales nicely. However, I am lost trying to figure out this unreliable behaviour. Maybe it has something to do with the hwloc warnings I get at configure?</span></div><div><span style="font-family:monospace">I am attaching the output of running the configure script.</span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)"><br></span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">Thank you very much for your helpful advices. I am looking forward to your reply.</span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)"><br></span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">Best regards,</span></span></div><div><span style="font-family:monospace"><span style="color:rgb(0,0,0)">Martin</span></span></div><div><span style="font-family:monospace"><br></span></div><div><br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Fri, May 8, 2020 at 2:48 PM Tony Curtis <<a href="mailto:anthony.curtis@stonybrook.edu">anthony.curtis@stonybrook.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="overflow-wrap: break-word;"><br><div><br><blockquote type="cite"><div>On May 8, 2020, at 1:41 AM, Martin Ivanov <<a href="mailto:marto1980@gmail.com" target="_blank">marto1980@gmail.com</a>> wrote:</div><br><div><div dir="ltr">Hello,<div>Thank you for your replies. I think another version of MPICH may not work as I am following a tutorial (<a href="https://www2.mmm.ucar.edu/wrf/OnLineTutorial/compilation_tutorial.php" target="_blank">https://www2.mmm.ucar.edu/wrf/OnLineTutorial/compilation_tutorial.php</a>) that requires specific library versions.</div><div>My /etc/hosts file contains only these two lines:</div><div><br></div><div>"</div><div>::1                    localhost localhost.my.domain<br>127.0.0.1                localhost localhost.my.domain<br></div><div>"</div><div><br></div><div>uname -n returns an empty string as I have not set a hostname. I guess I do not need this because I need to run MPICH only on this machine, that is on localhost? uname -a gives the following output:</div><div><br></div></div></div></blockquote><div><br></div><div>Thing is, though, your initial post showed ssh being used as launcher.  So in that case you would definitely need a hostname so you can resolve back to yourself (your shell prompt was a big clue, by the way).  Setting a hostname and making it an alias of localhost in /etc/hosts would probably do wonders no matter the underlying launch.</div><div><br></div><div>The -info output is pretty much the same as I see on FreeBSD.</div><div><br></div><div>If you run a hello world with a sleep in it to allow you to react, what does “ps x” show?</div><br></div><div>(Not familiar much with DragonFly beyond “poking at it” so I don’t have any particular insight there.)</div><div><br></div><div>Tony</div><div><br></div><br></div></blockquote></div>