Justin,  I just had a strange situation where suddenly my cluster failed.  here were the symptoms:<br><br>1) all my active ssh terminals timed out<br>2) i couldn&#39;t log back in as the CLUSTER_USER (I got the &quot;permission denied (public key)&quot; error  -- though I could ssh in as root<br>
3) the mounted EBS volume appears to have disappeared  -- e.g. when I tried to cd to it from /root, it was reported as not existing. <br>4) the SGE &quot;qstat&quot; command failed to be recognized.  (e.g. when i run &quot;qstat -xml&quot; as root I got an error in finding the qstat command.) <br>
<br>It seems like my EBS drive might have detached ... but lots of things could have happened.   Any thoughts? <br><br>Anyway, I killed the cluster as i didn&#39;t want o keep paying for it.  I&#39;m starting another one now, and will let you know what the result it.  If it happens again I&#39;ll keep the cluster up and let you know right away.<br>
<br>Dan<br><br>