<meta http-equiv="Content-Type" content="text/html; charset=utf-8"><div dir="ltr"><span class="" id=":377.1" tabindex="-1">Ok</span>. <div>That's next step I planned to do.</div><div>Thank you for advice.</div><div><br></div><div>Regards,</div><div><span class="" id=":377.2" tabindex="-1">Anatoly</span>.</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Oct 13, 2014 at 6:49 AM, Lu, Huiwei <span dir="ltr"><<a href="mailto:huiweilu@mcs.anl.gov" target="_blank">huiweilu@mcs.anl.gov</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">You may add printf to your application to report the application progress. So when it exits (or disappears), it will print the last message that can help you locate the error.<br>
—<br>
<span class="HOEnZb"><font color="#888888">Huiwei<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
On Oct 12, 2014, at 10:42 PM, Anatoly G <<a href="mailto:anatolyrishon@gmail.com">anatolyrishon@gmail.com</a>> wrote:<br>
<br>
> I'm not sure about my current failure.<br>
> I execute my application (MPI processes). Each process executes endless loop. After a couple of hours Master process fails (disappears - I can't see it using 'ps' command). There is no core file. I'm not sure about the reason of failure.<br>
> It looks strange that single process (15 processes executed) fails w/o core file dropping.<br>
> I suspect that I'm using MPICH in wrong way, which causes failure.<br>
> But like I said before I'm not sure about failure.<br>
><br>
> Regards,<br>
> Anatoly.<br>
><br>
> On Mon, Oct 13, 2014 at 6:21 AM, Wesley Bland <<a href="mailto:wbland@anl.gov">wbland@anl.gov</a>> wrote:<br>
> Calling MPI_Abort is not an error that would cause the OS to dump a core. For that, you'll need to do something within your application that would normally cause it to dump a core. MPICH itself won't do it for you. You can add a divide by zero error to your own code and you'll get a core file of your app. What specifically within MPICH are you trying to debug?<br>
><br>
> Thanks,<br>
> Wesley<br>
><br>
><br>
><br>
> On Oct 12, 2014, at 10:09 PM, Anatoly G <<a href="mailto:anatolyrishon@gmail.com">anatolyrishon@gmail.com</a>> wrote:<br>
><br>
>> Thank you.<br>
>> My OS (Kubuntu 14.04).<br>
>> ulimit is already set to unlimited.<br>
>> When I generate exception (abort() function or divide by zero) I always get a core file,<br>
>> but when MPICH fails (for example with MPI_Abort) no core file created.<br>
>> May be I need to change any other settings?<br>
>><br>
>><br>
>> Regards,<br>
>> Anatoly.<br>
>><br>
>> On Sun, Oct 12, 2014 at 4:47 PM, Lu, Huiwei <<a href="mailto:huiweilu@mcs.anl.gov">huiweilu@mcs.anl.gov</a>> wrote:<br>
>> The core file is created by the OS, not MPICH. What’s the output of ‘ulimit -c’ on your machine? Could you set ‘ulimit -c unlimited’ and try again?<br>
>><br>
>> —<br>
>> Huiwei<br>
>><br>
>> On Oct 12, 2014, at 7:35 AM, Anatoly G <<a href="mailto:anatolyrishon@gmail.com">anatolyrishon@gmail.com</a>> wrote:<br>
>><br>
>> > Dear MPICH.<br>
>> > I'm using MPICH3.1<br>
>> > After application run of 4-5 hours Master process fails, but it doesn't creates a core file.<br>
>> > When I used MPI_Abort (in the past) it not creates core file too.<br>
>> > Can I make MPICH create core in any fail (of course if it's MPI fail).<br>
>> ><br>
>> > Regards,<br>
>> > Anatoly.<br>
>> ><br>
>> > _______________________________________________<br>
>> > discuss mailing list     <a href="mailto:discuss@mpich.org">discuss@mpich.org</a><br>
>> > To manage subscription options or unsubscribe:<br>
>> > <a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
>><br>
>> _______________________________________________<br>
>> discuss mailing list     <a href="mailto:discuss@mpich.org">discuss@mpich.org</a><br>
>> To manage subscription options or unsubscribe:<br>
>> <a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
>><br>
>> _______________________________________________<br>
>> discuss mailing list     <a href="mailto:discuss@mpich.org">discuss@mpich.org</a><br>
>> To manage subscription options or unsubscribe:<br>
>> <a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
><br>
> _______________________________________________<br>
> discuss mailing list     <a href="mailto:discuss@mpich.org">discuss@mpich.org</a><br>
> To manage subscription options or unsubscribe:<br>
> <a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
><br>
> _______________________________________________<br>
> discuss mailing list     <a href="mailto:discuss@mpich.org">discuss@mpich.org</a><br>
> To manage subscription options or unsubscribe:<br>
> <a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
<br>
_______________________________________________<br>
discuss mailing list     <a href="mailto:discuss@mpich.org">discuss@mpich.org</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mpich.org/mailman/listinfo/discuss" target="_blank">https://lists.mpich.org/mailman/listinfo/discuss</a><br>
</div></div></blockquote></div><br></div>