<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><div dir="ltr"><div>I went and purged mpich and mpiexec/mpirun was still found from 'which' along with mpiexec.openmpi/mpirun.openmpi.  These are part of openmpi-common and after purging that and reinstalling mpich it is back to working order.  Not sure what installed the openmpi-common package, but that fixed it for me.<br><br></div>Thanks for your help!<br></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div>Seth Munholland, B.Sc.<br></div><div>Department of Biological Sciences<br>
Rm. 304 Biology Building<br>
University of Windsor<br>
401 Sunset Ave. N9B 3P4<br>
T: <a value="+15192533000">(519) 253-3000 Ext: 4755</a></div></div></div></div>
<br><div class="gmail_quote">On Wed, Feb 15, 2017 at 12:36 PM, Halim Amer <span dir="ltr"><<a href="mailto:halim.amer@acm.org" target="_blank">halim.amer@acm.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">You can use `which mpiexec` to figure out which binary you are using. Use `ldd <your binary>` to locate the MPI library you are linking to. Use `apt-file` to find which package(s) installed those files.<span class=""><br>
<br>
> Which it properly defined in /etc/hosts.  It compiled and executed<br>
> without error and returned all the processes I had on each node.  I went<br>
> on to install some programs on the NFS drive and when I tried to run it<br>
> I get the following error<br>
<br></span>
If your MPI program was working before you installed those programs, you could try uninstalling them. It could be that one of those programs have a dependency on Open MPI, so the problem might remain. In this case, you still need to locate the packages that installed the MPI binaries and libraries as shown above and uninstalled them.<br>
<br>
Halim<br>
<a href="http://www.mcs.anl.gov/~aamer" rel="noreferrer" target="_blank">www.mcs.anl.gov/~aamer</a><div class="HOEnZb"><div class="h5"><br>
<br>
On 2/15/17 10:26 AM, Seth Munholland wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
That's very strange as I never installed OpenMPI.  I used apt-get to<br>
install MPICH and have avoided OpenMPI to try and not get this issue.  I<br>
thought it would be an easy fix of uninstalling and reinstalling via<br>
apt-get, but I can't seem to actually remove this OpenMPI version.  Would a<br>
source compile write over the apt-get installed version?<br>
<br>
Seth Munholland, B.Sc.<br>
Department of Biological Sciences<br>
Rm. 304 Biology Building<br>
University of Windsor<br>
401 Sunset Ave. N9B 3P4<br>
T: <a href="tel:%28519%29%20253-3000%20Ext%3A%204755" value="+15192533000" target="_blank">(519) 253-3000 Ext: 4755</a><br>
<br>
On Wed, Feb 8, 2017 at 11:50 AM, Halim Amer <<a href="mailto:halim.amer@acm.org" target="_blank">halim.amer@acm.org</a>> wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi,<br>
<br>
It seems you are using Open MPI. You can whether contact the Open MPI team<br>
to look into your problem, or clean your environment (both binaries and<br>
libraries) if you want to use MPICH to make sure you are truly using MPICH<br>
when building and running your program.<br>
<br>
Halim<br>
<a href="http://www.mcs.anl.gov/~aamer" rel="noreferrer" target="_blank">www.mcs.anl.gov/~aamer</a><br>
<br>
<br>
On 2/8/17 10:18 AM, Seth Munholland wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hello everyone,<br>
<br>
I have been configuring a new ubuntu cluster and wanted it to run MPI<br>
programs.  I got mpich configured and compiled then ran the following as<br>
a test:<br>
<br>
#include <stdio.h><br>
#include <mpi.h><br>
<br>
int main (int argc, char** argv) {<br>
    int rank = 0, size = 0, nameLen = 0;<br>
    char procName[MPI_MAX_PROCESSOR_NAM<wbr>E];<br>
<br>
    MPI_Init (&argc, &argv);<br>
    MPI_Comm_size (MPI_COMM_WORLD, &size);<br>
    MPI_Comm_rank (MPI_COMM_WORLD, &rank);<br>
    MPI_Get_processor_name (procName, &nameLen);<br>
<br>
    printf ("Hello from processor %s, rank %d of %d\n", procName, rank,<br>
size);<br>
<br>
    MPI_Finalize();<br>
    return 0;<br>
}<br>
<br>
using the commands:<br>
mpicc mpi_hello.c -o mpi_hello<br>
mpiexec -mahcinefile machinefile mpi_hello<br>
<br>
my machienfile looks like this:<br>
beanblade4:24<br>
beanblade3:24<br>
beanblade2:24<br>
beanblade:24<br>
<br>
Which it properly defined in /etc/hosts.  It compiled and executed<br>
without error and returned all the processes I had on each node.  I went<br>
on to install some programs on the NFS drive and when I tried to run it<br>
I get the following error<br>
<br>
bash: orted: command not found<br>
------------------------------<wbr>------------------------------<br>
--------------<br>
ORTE was unable to reliably start one or more daemons.<br>
This usually is caused by:<br>
<br>
* not finding the required libraries and/or binaries on<br>
  one or more nodes. Please check your PATH and LD_LIBRARY_PATH<br>
  settings, or configure OMPI with --enable-orterun-prefix-by-def<wbr>ault<br>
<br>
* lack of authority to execute on one or more specified nodes.<br>
  Please verify your allocation and authorities.<br>
<br>
* the inability to write startup files into /tmp<br>
(--tmpdir/orte_tmpdir_base).<br>
  Please check with your sys admin to determine the correct location to<br>
use.<br>
<br>
*  compilation of the orted with dynamic libraries when static are<br>
required<br>
  (e.g., on Cray). Please check your configure cmd line and consider using<br>
  one of the contrib/platform definitions for your system type.<br>
<br>
* an inability to create a connection back to mpirun due to a<br>
  lack of common network interfaces and/or no route found between<br>
  them. Please check network connectivity (including firewalls<br>
  and network routing requirements).<br>
------------------------------<wbr>------------------------------<br>
--------------<br>
<br>
This error now gets returned when I try to run the mpi_hello program I<br>
used to test my mpi implementation.  if I drop the machinefile tag from<br>
my mpiexec command I get<br>
<br>
mpiexec ./mpi_hello<br>
------------------------------<wbr>------------------------------<br>
--------------<br>
[[14894,1],17]: A high-performance Open MPI point-to-point messaging<br>
module<br>
was unable to find any relevant network interfaces:<br>
<br>
Module: OpenFabrics (openib)<br>
  Host: beanblade<br>
<br>
Another transport will be used instead, although this may result in<br>
lower performance.<br>
------------------------------<wbr>------------------------------<br>
--------------<br>
Hello from processor beanblade, rank 18 of 24<br>
Hello from processor beanblade, rank 0 of 24<br>
Hello from processor beanblade, rank 2 of 24<br>
Hello from processor beanblade, rank 4 of 24<br>
Hello from processor beanblade, rank 6 of 24<br>
Hello from processor beanblade, rank 7 of 24<br>
Hello from processor beanblade, rank 3 of 24<br>
Hello from processor beanblade, rank 1 of 24<br>
Hello from processor beanblade, rank 5 of 24<br>
Hello from processor beanblade, rank 8 of 24<br>
Hello from processor beanblade, rank 12 of 24<br>
Hello from processor beanblade, rank 13 of 24<br>
Hello from processor beanblade, rank 11 of 24<br>
Hello from processor beanblade, rank 9 of 24<br>
Hello from processor beanblade, rank 10 of 24<br>
Hello from processor beanblade, rank 14 of 24<br>
Hello from processor beanblade, rank 15 of 24<br>
Hello from processor beanblade, rank 16 of 24<br>
Hello from processor beanblade, rank 17 of 24<br>
Hello from processor beanblade, rank 19 of 24<br>
Hello from processor beanblade, rank 20 of 24<br>
Hello from processor beanblade, rank 21 of 24<br>
Hello from processor beanblade, rank 22 of 24<br>
Hello from processor beanblade, rank 23 of 24<br>
[beanblade:13849] 23 more processes have sent help message<br>
help-mpi-btl-base.txt / btl:no-nics<br>
[beanblade:13849] Set MCA parameter "orte_base_help_aggregate" to 0 to<br>
see all help / error messages<br>
<br>
I've been trying to figure it out on the forums and I think it's<br>
somethign to do with my bashrc file (I have a few exports for<br>
environmental variables), but removing them didn't fix the problem.<br>
What did I break?  Where do I look to fix it?<br>
<br>
Seth Munholland, B.Sc.<br>
Department of Biological Sciences<br>
Rm. 304 Biology Building<br>
University of Windsor<br>
401 Sunset Ave. N9B 3P4<br>
T: <a href="tel:%28519%29%20253-3000%20Ext%3A%204755" value="+15192533000" target="_blank">(519) 253-3000 Ext: 4755</a><br>
<br>
<br>
______________________________<wbr>_________________<br>
discuss mailing list     <a href="mailto:discuss@mpich.org" target="_blank">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" rel="noreferrer" target="_blank">https://lists.mpich.org/mailma<wbr>n/listinfo/discuss</a><br>
<br>
______________________________<wbr>_________________<br>
</blockquote>
discuss mailing list     <a href="mailto:discuss@mpich.org" target="_blank">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" rel="noreferrer" target="_blank">https://lists.mpich.org/mailma<wbr>n/listinfo/discuss</a><br>
<br>
</blockquote>
<br>
<br>
<br>
______________________________<wbr>_________________<br>
discuss mailing list     <a href="mailto:discuss@mpich.org" target="_blank">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" rel="noreferrer" target="_blank">https://lists.mpich.org/mailma<wbr>n/listinfo/discuss</a><br>
<br>
</blockquote>
______________________________<wbr>_________________<br>
discuss mailing list     <a href="mailto:discuss@mpich.org" target="_blank">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" rel="noreferrer" target="_blank">https://lists.mpich.org/mailma<wbr>n/listinfo/discuss</a><br>
</div></div></blockquote></div><br></div>