<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
  </head>
  <body>
    I am verry sorry, it is not a mpich bug, the bug is in my app<br>
    Next time, I'll wait a couple of days before bothering you...<br>
    <br>
    <br>
    <div class="moz-cite-prefix">On 17/11/2022 16:32, Zhou, Hui wrote:<br>
    </div>
    <blockquote type="cite"
cite="mid:SA0PR09MB741743864659B97B401F379FA9069@SA0PR09MB7417.namprd09.prod.outlook.com">
      <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
      <style type="text/css" style="display:none;">P {margin-top:0;margin-bottom:0;}</style>
      <div style="font-family: Calibri, Arial, Helvetica, sans-serif;
        font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255,
        255, 255);" class="elementToProof">
        Bruno,</div>
      <div style="font-family: Calibri, Arial, Helvetica, sans-serif;
        font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255,
        255, 255);" class="elementToProof">
        <br>
      </div>
      <div style="font-family: Calibri, Arial, Helvetica, sans-serif;
        font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255,
        255, 255);" class="elementToProof">
        No, I was looking for the earlier part of the log where mpiexec
        launches proxies. You may cut out the dump of environment
        variables if those are sensitive.</div>
      <div style="font-family: Calibri, Arial, Helvetica, sans-serif;
        font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255,
        255, 255);" class="elementToProof">
        <br>
      </div>
      <div style="font-family: Calibri, Arial, Helvetica, sans-serif;
        font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255,
        255, 255);" class="elementToProof">
        -- <br>
      </div>
      <div style="font-family: Calibri, Arial, Helvetica, sans-serif;
        font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255,
        255, 255);" class="elementToProof">
        Hui<br>
      </div>
      <hr style="display:inline-block;width:98%" tabindex="-1">
      <div id="divRplyFwdMsg" dir="ltr"><font style="font-size:11pt"
          face="Calibri, sans-serif" color="#000000"><b>From:</b>
          <a class="moz-txt-link-abbreviated" href="mailto:bruno.guerraz@orange.com">bruno.guerraz@orange.com</a> <a class="moz-txt-link-rfc2396E" href="mailto:bruno.guerraz@orange.com"><bruno.guerraz@orange.com></a><br>
          <b>Sent:</b> Thursday, November 17, 2022 8:35 AM<br>
          <b>To:</b> Zhou, Hui <a class="moz-txt-link-rfc2396E" href="mailto:zhouh@anl.gov"><zhouh@anl.gov></a>; <a class="moz-txt-link-abbreviated" href="mailto:discuss@mpich.org">discuss@mpich.org</a>
          <a class="moz-txt-link-rfc2396E" href="mailto:discuss@mpich.org"><discuss@mpich.org></a><br>
          <b>Subject:</b> Re: [mpich-discuss] wrong number of processes
          on host</font>
        <div> </div>
      </div>
      <div>Is this log OK for you ?<br>
        <br>
        [pgid: 0] got PMI command: cmd=barrier_in<br>
        [pgid: 0] got PMI command: cmd=put
        sharedFilename[0]=/dev/shm/mpich_shar_tmpAOPuur<br>
        [pgid: 0] got PMI command: cmd=barrier_in<br>
        [pgid: 0] got PMI command: cmd=put
        sharedFilename[4]=/dev/shm/mpich_shar_tmp76zj4w<br>
        [pgid: 0] got PMI command: cmd=barrier_in<br>
        PMI response to fd 13 pid 4: cmd=keyval_cache
        sharedFilename[2]=/dev/shm/mpich_shar_tmppFa2Wf
        sharedFilename[0]=/dev/shm/mpich_shar_tmpAOPuur
        sharedFilename[4]=/dev/shm/mpich_shar_tmp76zj4w
        <br>
        PMI response to fd 12 pid 4: cmd=keyval_cache
        sharedFilename[2]=/dev/shm/mpich_shar_tmppFa2Wf
        sharedFilename[0]=/dev/shm/mpich_shar_tmpAOPuur
        sharedFilename[4]=/dev/shm/mpich_shar_tmp76zj4w
        <br>
        PMI response to fd 14 pid 4: cmd=keyval_cache
        sharedFilename[2]=/dev/shm/mpich_shar_tmppFa2Wf
        sharedFilename[0]=/dev/shm/mpich_shar_tmpAOPuur
        sharedFilename[4]=/dev/shm/mpich_shar_tmp76zj4w
        <br>
        PMI response to fd 13 pid 4: cmd=barrier_out<br>
        PMI response to fd 12 pid 4: cmd=barrier_out<br>
        PMI response to fd 14 pid 4: cmd=barrier_out<br>
        [pgid: 0] got PMI command: cmd=put
        P2-businesscard=description#l-neobi-1$port#39551$ifname#10.193.21.24$
P3-businesscard=description#l-neobi-1$port#49083$ifname#10.193.21.24$<br>
        [pgid: 0] got PMI command: cmd=barrier_in<br>
        [pgid: 0] got PMI command: cmd=put
        P0-businesscard=description#l-neobi-4$port#57647$ifname#10.193.21.65$
P1-businesscard=description#l-neobi-4$port#46287$ifname#10.193.21.65$<br>
        [pgid: 0] got PMI command: cmd=barrier_in<br>
        [pgid: 0] got PMI command: cmd=put
        P4-businesscard=description#l-neobi-3$port#48597$ifname#10.193.21.26$
P5-businesscard=description#l-neobi-3$port#47573$ifname#10.193.21.26$<br>
        [pgid: 0] got PMI command: cmd=barrier_in<br>
        PMI response to fd 13 pid 5: cmd=keyval_cache
        P2-businesscard=description#l-neobi-1$port#39551$ifname#10.193.21.24$
P3-businesscard=description#l-neobi-1$port#49083$ifname#10.193.21.24$
        P0-businesscard=description#l-neobi-4$port#57647$ifname#10.193.21.65$
P1-businesscard=description#l-neobi-4$port#46287$ifname#10.193.21.65$
        P4-businesscard=description#l-neobi-3$port#48597$ifname#10.193.21.26$
P5-businesscard=description#l-neobi-3$port#47573$ifname#10.193.21.26$
        <br>
        PMI response to fd 12 pid 5: cmd=keyval_cache
        P2-businesscard=description#l-neobi-1$port#39551$ifname#10.193.21.24$
P3-businesscard=description#l-neobi-1$port#49083$ifname#10.193.21.24$
        P0-businesscard=description#l-neobi-4$port#57647$ifname#10.193.21.65$
P1-businesscard=description#l-neobi-4$port#46287$ifname#10.193.21.65$
        P4-businesscard=description#l-neobi-3$port#48597$ifname#10.193.21.26$
P5-businesscard=description#l-neobi-3$port#47573$ifname#10.193.21.26$
        <br>
        PMI response to fd 14 pid 5: cmd=keyval_cache
        P2-businesscard=description#l-neobi-1$port#39551$ifname#10.193.21.24$
P3-businesscard=description#l-neobi-1$port#49083$ifname#10.193.21.24$
        P0-businesscard=description#l-neobi-4$port#57647$ifname#10.193.21.65$
P1-businesscard=description#l-neobi-4$port#46287$ifname#10.193.21.65$
        P4-businesscard=description#l-neobi-3$port#48597$ifname#10.193.21.26$
P5-businesscard=description#l-neobi-3$port#47573$ifname#10.193.21.26$
        <br>
        PMI response to fd 13 pid 5: cmd=barrier_out<br>
        PMI response to fd 12 pid 5: cmd=barrier_out<br>
        PMI response to fd 14 pid 5: cmd=barrier_out<br>
        <br>
        <div class="x_moz-cite-prefix">On 17/11/2022 15:30, Zhou, Hui
          wrote:<br>
        </div>
        <blockquote type="cite">
          <style type="text/css" style="display:none">p
        {margin-top:0;
        margin-bottom:0}</style>
          <div class="x_elementToProof"
            style="font-family:Calibri,Arial,Helvetica,sans-serif;
            font-size:12pt; color:rgb(0,0,0);
            background-color:rgb(255,255,255)">
            That is strange. Try pass <code>-v</code>​ option (i.e. <code>mpiexec
              -v</code>​ ...) to obtain a console log when that happens.</div>
          <div class="x_elementToProof"
            style="font-family:Calibri,Arial,Helvetica,sans-serif;
            font-size:12pt; color:rgb(0,0,0);
            background-color:rgb(255,255,255)">
            <br>
          </div>
          <div class="x_elementToProof"
            style="font-family:Calibri,Arial,Helvetica,sans-serif;
            font-size:12pt; color:rgb(0,0,0);
            background-color:rgb(255,255,255)">
            -- <br>
          </div>
          <div class="x_elementToProof"
            style="font-family:Calibri,Arial,Helvetica,sans-serif;
            font-size:12pt; color:rgb(0,0,0);
            background-color:rgb(255,255,255)">
            Hui<br>
          </div>
          <hr tabindex="-1" style="display:inline-block; width:98%">
          <div id="x_divRplyFwdMsg" dir="ltr"><font
              style="font-size:11pt" face="Calibri, sans-serif"
              color="#000000"><b>From:</b> bruno via discuss
              <a class="x_moz-txt-link-rfc2396E"
                href="mailto:discuss@mpich.org" moz-do-not-send="true"><discuss@mpich.org></a><br>
              <b>Sent:</b> Thursday, November 17, 2022 8:11 AM<br>
              <b>To:</b> <a class="x_moz-txt-link-abbreviated
                moz-txt-link-freetext" href="mailto:discuss@mpich.org"
                moz-do-not-send="true">
                discuss@mpich.org</a> <a
                class="x_moz-txt-link-rfc2396E"
                href="mailto:discuss@mpich.org" moz-do-not-send="true">
                <discuss@mpich.org></a><br>
              <b>Cc:</b> <a class="x_moz-txt-link-abbreviated
                moz-txt-link-freetext"
                href="mailto:bruno.guerraz@orange.com"
                moz-do-not-send="true">
                bruno.guerraz@orange.com</a> <a
                class="x_moz-txt-link-rfc2396E"
                href="mailto:bruno.guerraz@orange.com"
                moz-do-not-send="true">
                <bruno.guerraz@orange.com></a><br>
              <b>Subject:</b> [mpich-discuss] wrong number of processes
              on host</font>
            <div> </div>
          </div>
          <div class="x_BodyFragment"><font size="2"><span
                style="font-size:11pt">
                <div class="x_PlainText">Hi, I am using mpich on a
                  hadoop cluster with yarn. It is not a smooth
                  <br>
                  integration but it is working.<br>
                  Flowing an old post, I am using the manual launcher
                  and the option <br>
                  -disable-hostname-propagation <br>
                  (<a
                    href="https://lists.mpich.org/mailman/htdig/devel/2016-July/000717.html"
                    class="x_moz-txt-link-freetext
                    moz-txt-link-freetext" moz-do-not-send="true">https://lists.mpich.org/mailman/htdig/devel/2016-July/000717.html</a>)<br>
                  <br>
                  The command line to launch by binary is :<br>
                  <br>
                  mpiexec -launcher manual -disable-hostname-propagation
                  -n 6 -f ./hosts <br>
                  /path/to/my/bin<br>
                  <br>
                  And the file hosts contains<br>
                  <br>
                  host1:2<br>
                  host2:2<br>
                  host3:2<br>
                  <br>
                  I expect to have 2 processes on each host but most of
                  the time it <br>
                  launches 3 processes on host1, 1 on host2 and 2 on
                  host3<br>
                  Any ideas?<br>
                  <br>
                  Bruno<br>
                  <br>
_________________________________________________________________________________________________________________________<br>
                  <br>
                  Ce message et ses pieces jointes peuvent contenir des
                  informations confidentielles ou privilegiees et ne
                  doivent donc<br>
                  pas etre diffuses, exploites ou copies sans
                  autorisation. Si vous avez recu ce message par erreur,
                  veuillez le signaler<br>
                  a l'expediteur et le detruire ainsi que les pieces
                  jointes. Les messages electroniques etant susceptibles
                  d'alteration,<br>
                  Orange decline toute responsabilite si ce message a
                  ete altere, deforme ou falsifie. Merci.<br>
                  <br>
                  This message and its attachments may contain
                  confidential or privileged information that may be
                  protected by law;<br>
                  they should not be distributed, used or copied without
                  authorisation.<br>
                  If you have received this email in error, please
                  notify the sender and delete this message and its
                  attachments.<br>
                  As emails may be altered, Orange is not liable for
                  messages that have been modified, changed or
                  falsified.<br>
                  Thank you.<br>
                  <br>
                  _______________________________________________<br>
                  discuss mailing list     <a
                    class="x_moz-txt-link-abbreviated
                    moz-txt-link-freetext"
                    href="mailto:discuss@mpich.org"
                    moz-do-not-send="true">
                    discuss@mpich.org</a><br>
                  To manage subscription options or unsubscribe:<br>
                  <a
                    href="https://lists.mpich.org/mailman/listinfo/discuss"
                    class="x_moz-txt-link-freetext
                    moz-txt-link-freetext" moz-do-not-send="true">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
                </div>
              </span></font></div>
        </blockquote>
        <br>
        <pre>_________________________________________________________________________________________________________________________

Ce message et ses pieces jointes peuvent contenir des informations confidentielles ou privilegiees et ne doivent donc
pas etre diffuses, exploites ou copies sans autorisation. Si vous avez recu ce message par erreur, veuillez le signaler
a l'expediteur et le detruire ainsi que les pieces jointes. Les messages electroniques etant susceptibles d'alteration,
Orange decline toute responsabilite si ce message a ete altere, deforme ou falsifie. Merci.

This message and its attachments may contain confidential or privileged information that may be protected by law;
they should not be distributed, used or copied without authorisation.
If you have received this email in error, please notify the sender and delete this message and its attachments.
As emails may be altered, Orange is not liable for messages that have been modified, changed or falsified.
Thank you.
</pre>
      </div>
    </blockquote>
    <br>
  <PRE>_________________________________________________________________________________________________________________________

Ce message et ses pieces jointes peuvent contenir des informations confidentielles ou privilegiees et ne doivent donc
pas etre diffuses, exploites ou copies sans autorisation. Si vous avez recu ce message par erreur, veuillez le signaler
a l'expediteur et le detruire ainsi que les pieces jointes. Les messages electroniques etant susceptibles d'alteration,
Orange decline toute responsabilite si ce message a ete altere, deforme ou falsifie. Merci.

This message and its attachments may contain confidential or privileged information that may be protected by law;
they should not be distributed, used or copied without authorisation.
If you have received this email in error, please notify the sender and delete this message and its attachments.
As emails may be altered, Orange is not liable for messages that have been modified, changed or falsified.
Thank you.
</PRE></body>
</html>