<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><div dir="ltr">I'm not sure about my current failure.<div>I execute my application (MPI processes). Each process executes endless loop. After a couple of hours Master process fails (disappears - I can't see it using 'ps' command). There is no core file. I'm not sure about the reason of failure.</div><div>It looks strange that single process (15 processes executed) fails w/o core file dropping.</div><div>I suspect that I'm using MPICH in wrong way, which causes failure.</div><div>But like I said before I'm not sure about failure.</div><div><br></div><div>Regards,</div><div>Anatoly.</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Oct 13, 2014 at 6:21 AM, Wesley Bland <span dir="ltr"><<a href="mailto:wbland@anl.gov" target="_blank">wbland@anl.gov</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="auto"><div>Calling MPI_Abort is not an error that would cause the OS to dump a core. For that, you'll need to do something within your application that would normally cause it to dump a core. MPICH itself won't do it for you. You can add a divide by zero error to your own code and you'll get a core file of your app. What specifically within MPICH are you trying to debug?</div><div><br></div><div>Thanks,</div><div>Wesley<br><br><br></div><div><div class="h5"><div><br>On Oct 12, 2014, at 10:09 PM, Anatoly G <<a href="mailto:anatolyrishon@gmail.com" target="_blank">anatolyrishon@gmail.com</a>> wrote:<br><br></div><blockquote type="cite"><div><div dir="ltr">Thank you.<div>My OS (Kubuntu 14.04).</div><div>ulimit is already set to unlimited.</div><div>When I generate exception (abort() function or divide by zero) I always get a core file,</div><div>but when MPICH fails (for example with MPI_Abort) no core file created.</div><div>May be I need to change any other settings?</div><div><br></div><div><br></div><div>Regards,</div><div>Anatoly.</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Sun, Oct 12, 2014 at 4:47 PM, Lu, Huiwei <span dir="ltr"><<a href="mailto:huiweilu@mcs.anl.gov" target="_blank">huiweilu@mcs.anl.gov</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">The core file is created by the OS, not MPICH. What’s the output of ‘ulimit -c’ on your machine? Could you set ‘ulimit -c unlimited’ and try again?<br>
<br>
—<br>
Huiwei<br>
<div><div><br>
On Oct 12, 2014, at 7:35 AM, Anatoly G <<a href="mailto:anatolyrishon@gmail.com" target="_blank">anatolyrishon@gmail.com</a>> wrote:<br>
<br>
> Dear MPICH.<br>
> I'm using MPICH3.1<br>
> After application run of 4-5 hours Master process fails, but it doesn't creates a core file.<br>
> When I used MPI_Abort (in the past) it not creates core file too.<br>
> Can I make MPICH create core in any fail (of course if it's MPI fail).<br>
><br>
> Regards,<br>
> Anatoly.<br>
><br>
</div></div>> _______________________________________________<br>
> discuss mailing list     <a href="mailto:discuss@mpich.org" target="_blank">discuss@mpich.org</a><br>
> To manage subscription options or unsubscribe:<br>
> <a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
<br>
_______________________________________________<br>
discuss mailing list     <a href="mailto:discuss@mpich.org" target="_blank">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
</blockquote></div><br></div>
</div></blockquote><blockquote type="cite"><div><span>_______________________________________________</span><br><span>discuss mailing list     <a href="mailto:discuss@mpich.org" target="_blank">discuss@mpich.org</a></span><br><span>To manage subscription options or unsubscribe:</span><br><span><a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a></span></div></blockquote></div></div></div><br>_______________________________________________<br>
discuss mailing list     <a href="mailto:discuss@mpich.org">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br></blockquote></div><br></div>