Thanks for the pointer Justin!<br><br><div class="gmail_quote">On Thu, Sep 13, 2012 at 10:29 AM, Justin Riley <span dir="ltr">&lt;<a href="mailto:jtriley@mit.edu" target="_blank">jtriley@mit.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
-----BEGIN PGP SIGNED MESSAGE-----<br>
Hash: SHA1<br>
<br>
Hi Jesse,<br>
<br>
Sorry for the delay in responding but glad you figured out to use<br>
all-Ubuntu AMIs for both HVM and non-HVM nodes. With that said keep in<br>
mind that only HVM nodes are on the high speed network IIRC which means<br>
all traffic between master and nodes (e.g. NFS) will be suboptimal<br>
compared to the performance of an all HVM cluster.<br>
<br>
~Justin<br>
<div class="im"><br>
<br>
On 08/27/2012 05:59 PM, Jesse Lu wrote:<br>
&gt; Okay, figured out that using ami-999d49f0 for non-HVM master and<br>
&gt; ami-4583572c for HVM nodes makes SGE work well. It&#39;s my fault for<br>
&gt; not looking at the available public starcluster images carefully<br>
&gt; enough.<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; On Mon, Aug 27, 2012 at 2:26 PM, Jesse Lu &lt;<a href="mailto:jesselu@stanford.edu">jesselu@stanford.edu</a><br>
</div><div class="im">&gt; &lt;mailto:<a href="mailto:jesselu@stanford.edu">jesselu@stanford.edu</a>&gt;&gt; wrote:<br>
&gt;<br>
&gt; Sorry for the spam, but here&#39;s another follow-up.<br>
&gt;<br>
&gt; I found that this only happens when I use a non HVM-EBS AMI for<br>
&gt; the master, but an HWM-EBS for the master.<br>
&gt;<br>
&gt; This is probably because StarCluster copies the sge install from<br>
&gt; the master to the nodes, and this doesn&#39;t play nice when the nodes<br>
&gt; are CentOS based but the master is Ubuntu based.<br>
&gt;<br>
&gt; Any ideas for a work-around?<br>
&gt;<br>
&gt;<br>
&gt; On Mon, Aug 27, 2012 at 2:07 PM, Jesse Lu &lt;<a href="mailto:jesselu@stanford.edu">jesselu@stanford.edu</a><br>
</div><div class="im">&gt; &lt;mailto:<a href="mailto:jesselu@stanford.edu">jesselu@stanford.edu</a>&gt;&gt; wrote:<br>
&gt;<br>
&gt; Follow-up,<br>
&gt;<br>
&gt; Here are the contents of the installation log file (for grid<br>
&gt; engine)<br>
&gt;<br>
&gt; cat<br>
&gt; /opt/sge6/default/common/install_logs/execd_install_node001_2012-08-27_14:04:29.log<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Your $SGE_ROOT directory: /opt/sge6<br>
&gt;<br>
&gt;<br>
&gt; Using cell: &gt;default&lt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Using local execd spool directory<br>
&gt; [/opt/sge6/default/spool/exec_spool_local]<br>
&gt;<br>
&gt; Creating local configuration for host &gt;node001&lt; sgeadmin@node001<br>
&gt; modified &quot;node001&quot; in configuration list Local configuration for<br>
&gt; host &gt;node001&lt; created.<br>
&gt;<br>
&gt; Host &gt;master&lt; already in submit host list! Host &gt;node001&lt; already<br>
&gt; in submit host list!<br>
&gt;<br>
&gt;<br>
&gt; starting sge_execd<br>
&gt;<br>
&gt;<br>
&gt; No modification because &quot;node001&quot; already exists in &quot;hostlist&quot; of<br>
&gt; &quot;hostgroup&quot; root@node001 modified &quot;@allhosts&quot; in host group list<br>
&gt; root@node001 modified &quot;all.q&quot; in cluster queue list<br>
&gt;<br>
&gt; got select error: Connection refused got select error: closing<br>
&gt; &quot;node001/execd/1&quot; Execd on host node001 is not started!<br>
&gt;<br>
&gt;<br>
&gt; On Mon, Aug 27, 2012 at 1:37 PM, Jesse Lu &lt;<a href="mailto:jesselu@stanford.edu">jesselu@stanford.edu</a><br>
</div><div class="im">&gt; &lt;mailto:<a href="mailto:jesselu@stanford.edu">jesselu@stanford.edu</a>&gt;&gt; wrote:<br>
&gt;<br>
&gt; ami-12b6477b produces the folowing error on cluster startup<br>
&gt;<br>
&gt; !!! ERROR - command &#39;cd /opt/sge6 &amp;&amp; TERM=rxvt ./inst_sge -x<br>
&gt; -noremote -auto ./ec2_sge.conf&#39; failed with status 1<br>
&gt;<br>
&gt; I&#39;m guessing the sge6 installation is faulty? Can anyone help?<br>
&gt; Thanks!<br>
&gt;<br>
&gt; Jesse<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
</div>&gt; _______________________________________________ StarCluster mailing<br>
&gt; list <a href="mailto:StarCluster@mit.edu">StarCluster@mit.edu</a><br>
&gt; <a href="http://mailman.mit.edu/mailman/listinfo/starcluster" target="_blank">http://mailman.mit.edu/mailman/listinfo/starcluster</a><br>
&gt;<br>
<br>
-----BEGIN PGP SIGNATURE-----<br>
Version: GnuPG v2.0.19 (GNU/Linux)<br>
Comment: Using GnuPG with Mozilla - <a href="http://enigmail.mozdev.org/" target="_blank">http://enigmail.mozdev.org/</a><br>
<br>
iEYEARECAAYFAlBSF/4ACgkQ4llAkMfDcrlSwwCbB5lJLmj4GY9rriY9jfxNdqO3<br>
s2UAn13+cEYu9bCqx6jiAP/wuPdetm+D<br>
=Dyis<br>
-----END PGP SIGNATURE-----<br>
</blockquote></div><br>