Hi Rayson,<div><br></div><div>The exact command is this - </div><div><br></div><div>ssh -i key root@publicDns &lt;&lt; EOD </div><div>qsub -N bt-mz.A.2 -b y -cwd -pe orte 2 mpirun ~/NPB3.3.1-MZ/NPB3.3-MZ-MPI/bin/bt-mz.A.2</div>
<div>EOD</div><div><br></div><div>1) I&#39;m running the NASA Parallel Benchmark. It has classes A to F which determine how large the benchmark is, and the number of MPI processes to run on which is the last digit (1, 2, 4, 8...128). Out of the 43 such benchmarks, 22 gave the correct result. For the remaining either the output size is zero, half complete output or no output at all. If the run any of these failed benchmarks individually, they run correctly.</div>
<div><br></div><div>2) I&#39;ve found a few bugs, have got a few log files (around 22). What is the best way to submit those?</div><div><br></div><div>Thanks</div><div>Ashish</div><div class="gmail_extra"><br><br><div class="gmail_quote">
On Wed, Nov 21, 2012 at 12:05 PM, Rayson Ho <span dir="ltr">&lt;<a href="mailto:raysonlogin@gmail.com" target="_blank">raysonlogin@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi Ashish,<br>
<br>
Can you list the qsub parameters you use to submit the jobs?<br>
<br>
Rayson<br>
<br>
==================================================<br>
Open Grid Scheduler - The Official Open Source Grid Engine<br>
<a href="http://gridscheduler.sourceforge.net/" target="_blank">http://gridscheduler.sourceforge.net/</a><br>
<div><div class="h5"><br>
<br>
On Tue, Nov 20, 2012 at 5:56 AM, Ashish Jain &lt;<a href="mailto:ashishj@usc.edu">ashishj@usc.edu</a>&gt; wrote:<br>
&gt; Hi,<br>
&gt;<br>
&gt; I&#39;m trying to submit many jobs at one go. I have 3 nodes each a EC2 1.4x<br>
&gt; cluster. There are few glitches I have seen with this -<br>
&gt;<br>
&gt; 1) If I submit the job at one go ( around 6 jobs each needing one process),<br>
&gt; apart from the first job, the rest of the jobs are put in a &quot;t&quot; state for a<br>
&gt; long time<br>
&gt; 2) If i space out the jobs ( sleep of 15 seconds between calls), the jobs<br>
&gt; are run more smoothly. However I&#39;m seeing an issue where the jobs are not<br>
&gt; writing the .o and .e files, and sometimes when they write, they are either<br>
&gt; incomplete or empty.<br>
&gt;<br>
&gt; I would like to understand what is happening here. Is there a minimum time<br>
&gt; between submitting jobs?<br>
&gt;<br>
&gt; Thanks<br>
&gt; Ashish<br>
&gt;<br>
</div></div>&gt; _______________________________________________<br>
&gt; StarCluster mailing list<br>
&gt; <a href="mailto:StarCluster@mit.edu">StarCluster@mit.edu</a><br>
&gt; <a href="http://mailman.mit.edu/mailman/listinfo/starcluster" target="_blank">http://mailman.mit.edu/mailman/listinfo/starcluster</a><br>
&gt;<br>
</blockquote></div><br></div>