<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div>Thank you so much Ken for your reply.</div><div><br></div><div>Do I have to copy executable file to all machines? what I am doing is, coding, compiling and running on a single machine and host_file contains name of the other machines.</div><div><br></div><div>I have run the command you gave me to run. it is printing the only name of the machine I am executing command and showing all previous errors. Here are the outputs after running the command twice:</div><div><br></div><div><br></div><div><div>[mhossain@md-lin-01 mpi_hello_world]$ /usr/lib64/mpich/bin/mpirun -n 4 -f host_file hostname</div><div><a href="http://md-lin-01.mcs.kent.edu">md-lin-01.mcs.kent.edu</a></div><div>[<a href="mailto:proxy%3A0%3A1@md-lin-02.mcs.kent.edu">proxy:0:1@md-lin-02.mcs.kent.edu</a>] launch_procs (./pm/pmiserv/pmip_cb.c:648): unable to change wdir to /home/mhossain/testMpi/mpi_hello_world (No such file or directory)</div><div>[<a href="mailto:proxy%3A0%3A1@md-lin-02.mcs.kent.edu">proxy:0:1@md-lin-02.mcs.kent.edu</a>] HYD_pmcd_pmip_control_cmd_cb (./pm/pmiserv/pmip_cb.c:893): launch_procs returned error</div><div>[<a href="mailto:proxy%3A0%3A1@md-lin-02.mcs.kent.edu">proxy:0:1@md-lin-02.mcs.kent.edu</a>] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status</div><div>[<a href="mailto:proxy%3A0%3A1@md-lin-02.mcs.kent.edu">proxy:0:1@md-lin-02.mcs.kent.edu</a>] main (./pm/pmiserv/pmip.c:206): demux engine error waiting for event</div><div>[<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>] control_cb (./pm/pmiserv/pmiserv_cb.c:202): assert (!closed) failed</div><div>[<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status</div><div>[<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>] HYD_pmci_wait_for_completion (./pm/pmiserv/pmiserv_pmci.c:197): error waiting for event</div><div>[<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>] main (./ui/mpich/mpiexec.c:331): process manager error waiting for completion</div><div><br></div><div>[mhossain@md-lin-01 mpi_hello_world]$ /usr/lib64/mpich/bin/mpirun -n 4 -f host_file hostname</div><div><a href="http://md-lin-01.mcs.kent.edu">md-lin-01.mcs.kent.edu</a></div><div>[<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>] control_cb (./pm/pmiserv/pmiserv_cb.c:202): assert (!closed) failed</div><div>[<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status</div><div>[<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>] HYD_pmci_wait_for_completion (./pm/pmiserv/pmiserv_pmci.c:197): error waiting for event</div><div>[<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>] main (./ui/mpich/mpiexec.c:331): process manager error waiting for completion</div><div><br></div></div><div><br></div><div>Is this problem with configuration or MPICH version?</div><div><br></div><div>Regards</div><div>Amjad</div></blockquote><div><br></div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div><br></div>
<br>
Does your mpi_hello_world binary exist in the same directory on all the<br>
machines you are trying to run on? Can you try running this:<br>
<br>
/usr/lib64/mpich/bin/mpirun -n 4 -f host_file hostname<br>
<br>
If it outputs the names of the hosts in your hostfile, we can be<br>
confident that your mpirun and ssh setup is functioning correctly.<br>
<br>
Ken<br></blockquote><div><br></div><div><br></div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<br>
On 10/21/2014 12:09 AM, Md. Amjad Hossain wrote:<br>
> Hi I am trying to run simple hello world program on cluster nodes. I am<br>
> running it by following command but getting errors:<br>
><br>
> Command:  /usr/lib64/mpich/bin/mpirun -n 4 -f host_file ./mpi_hello_world<br>
><br>
> errors:<br>
> [<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a> <mailto:<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>>]<br>
> control_cb (./pm/pmiserv/pmiserv_cb.c:202): assert (!closed) failed<br>
> [<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a> <mailto:<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>>]<br>
> HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback<br>
> returned error status<br>
> [<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a> <mailto:<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>>]<br>
> HYD_pmci_wait_for_completion (./pm/pmiserv/pmiserv_pmci.c:197): error<br>
> waiting for event<br>
> [<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a> <mailto:<a href="mailto:mpiexec@md-lin-01.mcs.kent.edu">mpiexec@md-lin-01.mcs.kent.edu</a>>]<br>
> main (./ui/mpich/mpiexec.c:331): process manager error waiting for<br>
> completion<br>
><br>
><br>
> Before running the command I am setting variables MPIRUN =mpi diretory<br>
> and MPI_HOSTS=host_file. The "host_file" has four nodes and they can ssh<br>
> to each other without password.<br>
><br>
> MPICH version I am running is: 3.0.4. The MPI code is attached.<br>
><br>
> Any help to solve the problem please?<br>
><br>
><br>
><br>
><br>
><br>
><br>
</blockquote></div><br></div></div>