<div dir="ltr">Hyokun,<div><br></div><div>Other source that you can take advantage of is this forum dedicated to OGE: <a href="http://gridengine.org/blog/2011/01/27/gridengine-users-mailing-list/">http://gridengine.org/blog/2011/01/27/gridengine-users-mailing-list/</a></div>
<div><br></div><div>All best,</div><div><br>Sergio</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Mon, Aug 19, 2013 at 1:53 AM, Hyokun Yun <span dir="ltr">&lt;<a href="mailto:yun3@purdue.edu" target="_blank">yun3@purdue.edu</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div>Dear starcluster users,</div><div><br></div><div><br></div><div>I am experiencing a problem using MPICH2 plugin with SGE.</div>
<div><br></div><div>I am using the following image: ami-52a0c53b which uses Ubuntu 12.04</div>
<div><br></div><div>When I use mpich2 plugin, it seems like mpich2 and SGE are not tightly integrated: when I execute my script using qsub, I get the following error message.</div><div><br></div><div>error: executing task of job 1 failed: execution daemon on host &quot;node001&quot; didn&#39;t accept task</div>

<div>error: executing task of job 1 failed: execution daemon on host &quot;node002&quot; didn&#39;t accept task</div><div>error: executing task of job 1 failed: execution daemon on host &quot;node003&quot; didn&#39;t accept task</div>

<div>error: executing task of job 1 failed: execution daemon on host &quot;nodef004&quot; didn&#39;t accept task</div><div><br></div><div>It runs fine when I simply execute &#39;mpirun&#39; myself, instead of relying on SGE.</div>

<div>Also, the same script runs fine as well when I use OpenMPI instead of MPICH2.  That&#39;s why I suspect it is MPICH2 &amp; SGE integration issue.</div><div><br></div><div>The problem is that I need multi-thread support, and it is by default disabled in OpenMPI.  I also prefer to use MPICH2 instead of OpenMPI.</div>

<div><br></div><div>I was able to reproduce the problem when I restarted the cluster from scratch.  Would any of you please take a look on the problem by trying the same image with MPICH2 plugin?</div><div><br></div><div>

<br></div><div>Thanks,</div><div>Hyokun Yun</div>
</div>
<br>_______________________________________________<br>
StarCluster mailing list<br>
<a href="mailto:StarCluster@mit.edu">StarCluster@mit.edu</a><br>
<a href="http://mailman.mit.edu/mailman/listinfo/starcluster" target="_blank">http://mailman.mit.edu/mailman/listinfo/starcluster</a><br>
<br></blockquote></div><br></div>