<div dir="ltr"><div><div>Hi Ron,<br></div><br></div>Thanks for your help! You are right. I finished one job. And the file /opt/sge6/default/common/accounting was created.<br><br><div class="gmail_extra"><br><br><div class="gmail_quote">
On Mon, Feb 25, 2013 at 12:04 AM, Ron Chen <span dir="ltr">&lt;<a href="mailto:ron_chen_123@yahoo.com" target="_blank">ron_chen_123@yahoo.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
What is the outout of qstat and qacct without any arguments to those commands? And did your cluster finish running any jobs?<br>
<br>
The file /opt/sge6/default/common/accounting is only there if there were jobs finished running.<br>
<br>
 -Ron<br>
<br>
************************************************************************<br>
Open Grid Scheduler - the official open source Grid Engine: <a href="http://gridscheduler.sourceforge.net/" target="_blank">http://gridscheduler.sourceforge.net/</a><br>
<br>
<br>
<br>
________________________________<br>
From: Kai Li &lt;<a href="mailto:kai.li.jx@gmail.com">kai.li.jx@gmail.com</a>&gt;<br>
To: <a href="mailto:starcluster@mit.edu">starcluster@mit.edu</a><br>
Sent: Saturday, February 23, 2013 7:32 PM<br>
Subject: [StarCluster] error of loadbalance ( can not list current job )<br>
<div><div class="h5"><br>
<br>
Hi,<br>
<br>
When I use Starcluster, I got the following error message when I tried to use &quot;starcluster loadbalance&quot;<br>
<br>
<br>
&gt;&gt;&gt; Loading full job history<br>
*** WARNING - Failed to retrieve stats (5/5):<br>
Traceback (most recent call last):<br>
  File &quot;/home/kli/.local/lib/python2.7/site-packages/StarCluster-0.9999-py2.7.egg/starcluster/balancers/sge/__init__.py&quot;, line 515, in get_stats<br>
    self.stat = self._get_stats()<br>
  File &quot;/home/kli/.local/lib/python2.7/site-packages/StarCluster-0.9999-py2.7.egg/starcluster/balancers/sge/__init__.py&quot;, line 493, in _get_stats<br>
    qacct = &#39;\n&#39;.join(master.ssh.execute(qacct_cmd))<br>
  File &quot;/home/kli/.local/lib/python2.7/site-packages/StarCluster-0.9999-py2.7.egg/starcluster/sshutils/__init__.py&quot;, line 538, in execute<br>
    msg, command, exit_status, out_str)<br>
RemoteCommandFailed: remote command &#39;source /etc/profile &amp;&amp; qacct -j -b 201302232051&#39; failed with status 1:<br>
no jobs running since startup<br>
/opt/sge6/default/common/accounting: No such file or directory<br>
*** WARNING - Retrying in 60s<br>
!!! ERROR - Failed to retrieve SGE stats after trying 5 times,<br>
!!! ERROR - exiting...<br>
<br>
<br>
<br>
And I&#39;ve tried qacct -j -b 201302232046 on masternode and also got the error message of &quot;/opt/sge6/default/common/accounting: No such file or directory&quot;Can anyone give me some hint to fix it? Thanks!<br>
<br>
--<br>
李凯 ( Kai Li )<br>
</div></div>_______________________________________________<br>
StarCluster mailing list<br>
<a href="mailto:StarCluster@mit.edu">StarCluster@mit.edu</a><br>
<a href="http://mailman.mit.edu/mailman/listinfo/starcluster" target="_blank">http://mailman.mit.edu/mailman/listinfo/starcluster</a><br>
</blockquote></div><br><br clear="all"><br>-- <br><span style="color:rgb(136,136,136)">李凯 ( Kai Li )</span></div></div>