<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
That is a bug that should be now fixed in current master. Additionally we added a short test program in `src/pm/hydra/maint` (slurm_nodelist_parse) that you can use to test your node list format to see whether it will cause problems with MPICH. If that fails
 please provide the output of such program in your message and we will look into it.
<div class=""><br class="">
<div class="">
<div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; text-decoration: none;">
Giuseppe Congiu</div>
<div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; text-decoration: none;">
Postdoctoral Appointee</div>
<div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; text-decoration: none;">
MCS Division</div>
<div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; text-decoration: none;">
Argonne National Laboratory</div>
<div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; text-decoration: none;">
9700 South Cass Ave., Lemont, IL 60439</div>
<div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; text-decoration: none;" class="">
<br class="">
</div>
<br class="Apple-interchange-newline">
</div>
<div><br class="">
<blockquote type="cite" class="">
<div class="">On Dec 4, 2019, at 4:28 PM, Stefan via discuss <<a href="mailto:discuss@mpich.org" class="">discuss@mpich.org</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div class="">Hi,<br class="">
<br class="">
I'm having some issues to make mpirun/mpiexec play nicely with Slurm<br class="">
allocations. I'm using Slurm 19.05.4, and have configured MPICH with:<br class="">
--enable-shared --enable-static --with-slurm=/sw/slurm/19.05.4 \<br class="">
--with-pm=hydra<br class="">
<br class="">
Now I request resources from Slurm with:<br class="">
$ salloc -N 2 --ntasks-per-node 4<br class="">
<br class="">
Then when I try to run a test binary:<br class="">
$ mpiexec.hydra ./mpich_hello<br class="">
Error: node list format not recognized. Try using '-hosts=<hostnames>'.<br class="">
Aborted (core dumped)<br class="">
<br class="">
When I do the same with OpenMPI's mpirun/mpiexec it runs on the allocated<br class="">
nodes. Am I missing something, or does MPICH simply not support this use case?<br class="">
<br class="">
Currently I'm working around this by using a script to translate Slurm<br class="">
node allocations into a host list and run like this:<br class="">
$ mpiexec.hydra -hosts $(mpich-host) ./mpich_hello<br class="">
<br class="">
That works fine, but I suppose this workaround should not be necessary.<br class="">
Here is ltrace output which shows that mpiexec tries to process some Slurm<br class="">
related environment variables but apparently fails to do so:<br class="">
<a href="https://paste.ubuntu.com/p/327tGrTzq5/" class="">https://paste.ubuntu.com/p/327tGrTzq5/</a><br class="">
<br class="">
I've also tried with salloc -N 1 -n 1, so that the environment variables<br class="">
are simpler, e.g.<br class="">
SLURM_NODELIST=node-b01<br class="">
SLURM_TASKS_PER_NODE=1<br class="">
but that did not change the way mpiexec fails.<br class="">
<br class="">
/Stefan<br class="">
_______________________________________________<br class="">
discuss mailing list     <a href="mailto:discuss@mpich.org" class="">discuss@mpich.org</a><br class="">
To manage subscription options or unsubscribe:<br class="">
<a href="https://lists.mpich.org/mailman/listinfo/discuss" class="">https://lists.mpich.org/mailman/listinfo/discuss</a><br class="">
</div>
</div>
</blockquote>
</div>
<br class="">
</div>
</body>
</html>