<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Hello,<br><br>I encountered continuing errors when trying to remove nodes using loadbalancer. <br><br>From error messages (which is appended below), I got an error regarding the user object.I am just using the default user &quot;sgeadmin&quot;. <br>
<br>I log in the &quot;tried to remove&quot; node and can verify that following steps have been done:<br><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">1. the node has been removed from SGE<br>
</div><div class="gmail_default" style="font-family:verdana,sans-serif">2. NFS has been unmounted<br></div><div class="gmail_default" style="font-family:verdana,sans-serif">3. sgeadmin user has been deleted <br></div><div class="gmail_default" style="font-family:verdana,sans-serif">
4. the hosts file has no ip of any other nodes or masters instance<br><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">But this node is not terminated and still show up when I &quot;starcluster lc&quot;. <br>
</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">
Thanks!<br>Jin<br></div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">
<br>&gt;&gt;&gt; Running plugin starcluster.plugins.sge.SGEPlugin<br>&gt;&gt;&gt; Removing node037 from SGE<br>&gt;&gt;&gt; Updating SGE parallel environment &#39;orte&#39;<br>50/50 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 100%<br>
&gt;&gt;&gt; Adding parallel environment &#39;orte&#39; to queue &#39;all.q&#39;<br>&gt;&gt;&gt; Running plugin starcluster.clustersetup.DefaultClusterSetup<br>&gt;&gt;&gt; Removing node node037 (i-1f013c34)...<br>&gt;&gt;&gt; Removing node037 from known_hosts files<br>
!!! ERROR - Error occured while running plugin &#39;starcluster.clustersetup.DefaultClusterSetup&#39;:<br>!!! ERROR - Failed to remove node node037<br>Traceback (most recent call last):<br>  File &quot;/usr/local/lib/python2.7/dist-packages/StarCluster-0.95.5-py2.7.egg/starcluster/balancers/sge/__init__.py&quot;, line 754, in _eval_remove_node<br>
    self._cluster.remove_node(node)<br>  File &quot;/usr/local/lib/python2.7/dist-packages/StarCluster-0.95.5-py2.7.egg/starcluster/cluster.py&quot;, line 1050, in remove_node<br>    force=force)<br>  File &quot;/usr/local/lib/python2.7/dist-packages/StarCluster-0.95.5-py2.7.egg/starcluster/cluster.py&quot;, line 1076, in remove_nodes<br>
    reverse=True)<br>  File &quot;/usr/local/lib/python2.7/dist-packages/StarCluster-0.95.5-py2.7.egg/starcluster/cluster.py&quot;, line 1690, in run_plugins<br>    self.run_plugin(plug, method_name=method_name, node=node)<br>
  File &quot;/usr/local/lib/python2.7/dist-packages/StarCluster-0.95.5-py2.7.egg/starcluster/cluster.py&quot;, line 1715, in run_plugin<br>    func(*args)<br>  File &quot;/usr/local/lib/python2.7/dist-packages/StarCluster-0.95.5-py2.7.egg/starcluster/clustersetup.py&quot;, line 407, in on_remove_node<br>
    self._remove_from_known_hosts(node)<br>  File &quot;/usr/local/lib/python2.7/dist-packages/StarCluster-0.95.5-py2.7.egg/starcluster/clustersetup.py&quot;, line 397, in _remove_from_known_hosts<br>    n.remove_from_known_hosts(self._user, [node])<br>
  File &quot;/usr/local/lib/python2.7/dist-packages/StarCluster-0.95.5-py2.7.egg/starcluster/node.py&quot;, line 588, in remove_from_known_hosts<br>    known_hosts_file = posixpath.join(user.pw_dir, &#39;.ssh&#39;, &#39;known_hosts&#39;)<br>
AttributeError: &#39;NoneType&#39; object has no attribute &#39;pw_dir&#39;<br>&gt;&gt;&gt; Sleeping...(looping again in 60 secs)<br><br></div></div>