<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><div dir="ltr">This may be related to <a href="https://trac.mpich.org/projects/mpich/ticket/1799" target="_blank">https://trac.mpich.org/projects/mpich/ticket/1799</a> and  <a href="https://trac.mpich.org/projects/mpich/ticket/2213" target="_blank">https://trac.mpich.org/projects/mpich/ticket/2213</a>, or at least I speculate that changing host hostnames are parsed might address all three at once.<div><br></div><div>Jeff<br><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Aug 14, 2015 at 7:32 AM, Nevolin, Andrey <span dir="ltr"><<a href="mailto:Andrey.Nevolin@emc.com" target="_blank">Andrey.Nevolin@emc.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">





<div lang="EN-US" link="blue" vlink="purple">
<div>
<p class="MsoNormal">Hi,<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">I installed MPICH on a cluster deployed in a virtual environment. After that I spent a lot of time trying to figure out why it doesn’t work.<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">I’m new to MPICH (and even to MPI). Hence my suggestions about the system functioning may contradict to the real world. But looks like in my case the problem has the following roots:<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">1) Looks like MPICH nodes use something similar to ‘hostname –i’ to discover their own IPs<u></u><u></u></p>
<p class="MsoNormal">2) If several IP aliases exist for a single host name, MPICH picks the first of them<u></u><u></u></p>
<p class="MsoNormal">3) Order of IP aliases resembles their order in ‘/etc/hosts/’ list<u></u><u></u></p>
<p class="MsoNormal">4) VMWare hypervisor automatically adds loop back alias for the host name (when the cluster is deployed by cloning of a single node). And this alias is added as a first line in ‘/etc/hosts’<u></u><u></u></p>
<p class="MsoNormal">5) All of the above means that MPICH discovers loop back IP in my case.<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">The problem disappeared when I removed loop back alias from ‘/etc/hosts/’.<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">Please, change IP discovery process to avoid loop back IP. Or add an explicit requirement to documentation to avoid loop back aliases in ‘/etc/hosts’.<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">Thanks,<u></u><u></u></p>
<p class="MsoNormal">                --Andrey<span><font color="#888888"><u></u><u></u></font></span></p><span><font color="#888888">
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal"><a href="https://twitter.com/Andrey_Nevolin" target="_blank">@Andrey_Nevolin</a><u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
</font></span></div>
</div>

<br>_______________________________________________<br>
discuss mailing list     <a href="mailto:discuss@mpich.org" target="_blank">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" rel="noreferrer" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div>Jeff Hammond<br><a href="mailto:jeff.science@gmail.com" target="_blank">jeff.science@gmail.com</a><br><a href="http://jeffhammond.github.io/" target="_blank">http://jeffhammond.github.io/</a></div>
</div></div></div>