Hi all,<div><br></div><div>I've run into a problem with "addnode" that I'm having a difficult time diagnosing.   Using the development version of starcluster, when I issue a starcluster addnode, the nodes added in the resulting cluster are unusable -- they result in SGE errors.  Jobs run on the master node, but any nodes I've added are broken.  If, however, I start the cluster with multiple nodes then resulting nodes are all usable (so it's not a user code issue).  I have a hunch that this is due to the fact that we have several users working under the same account (as different AWS IAM users) and we are not all on the same StarCluster version.  To be clear, we are all on varying stages of the developmental version (0.9999).  Where do I begin debugging this?  The hostfile seems to be set up correctly (see output below).</div>
<div><br></div><div>Thanks,<br>Dan</div><div><br></div><div><div>danp@master:~$ cat /etc/hosts</div><div>127.0.0.1 localhost</div><div><br></div><div># The following lines are desirable for IPv6 capable hosts</div><div>::1 ip6-localhost ip6-loopback</div>
<div>fe00::0 ip6-localnet</div><div>ff00::0 ip6-mcastprefix</div><div>ff02::1 ip6-allnodes</div><div>ff02::2 ip6-allrouters</div><div>ff02::3 ip6-allhosts</div><div>10.196.149.155 master</div><div>10.226.219.58 node001</div>
</div><div><br></div><div>And here's what the errors look like:</div><div><br></div><div><div>danp@master:~$ qstat -f</div><div>queuename                      qtype resv/used/tot. load_avg arch          states</div><div>
---------------------------------------------------------------------------------</div><div>all.q@master                   BIP   0/0/8          1.29     lx24-amd64    </div><div>---------------------------------------------------------------------------------</div>
<div>all.q@node001                  BIP   0/0/8          0.70     lx24-amd64    </div><div><br></div><div>############################################################################</div><div> - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS</div>
<div>############################################################################</div><div>      1 0.55500 postList   danp         Eqw   11/26/2012 16:54:38     1        </div><div>      3 0.55500 postList   danp         Eqw   11/26/2012 16:54:39     1        </div>
<div>      5 0.55500 postList   danp         Eqw   11/26/2012 16:54:39     1        </div><div>      7 0.55500 postList   danp         Eqw   11/26/2012 16:54:39     1        </div><div>      8 0.55500 postList   danp         Eqw   11/26/2012 16:54:40     1        </div>
<div>      9 0.55500 postList   danp         Eqw   11/26/2012 16:54:40     1        </div><div>     10 0.55500 postList   danp         Eqw   11/26/2012 16:54:40     1        </div><div>     11 0.55500 postList   danp         Eqw   11/26/2012 16:54:40     1        </div>
<div>     13 0.55500 postList   danp         Eqw   11/26/2012 16:54:40     1        </div><div>     15 0.55500 postList   danp         Eqw   11/26/2012 16:54:41     1        </div></div><div><br></div><div><br></div><div>
<br clear="all"><div><br></div><br>
</div>