Hi Justin,<div><br></div><div>ok great. I have something running right now that I don&#39;t want to interrupt, but I might be able to take a stab at it tomorrow and will report back then.</div><div><br></div><div>cheers </div>

<div>Paul</div><div><br><div class="gmail_quote">On Wed, Jan 18, 2012 at 23:17, Justin Riley <span dir="ltr">&lt;<a href="mailto:jtriley@mit.edu">jtriley@mit.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div class="im">-----BEGIN PGP SIGNED MESSAGE-----<br>
Hash: SHA1<br>
<br>
Hi Paul,<br>
<br>
</div>No problem at all and thanks for the kind words. From my limited<br>
testing I believe this is fixed in the latest github code which will<br>
be included in tomorrow&#39;s patch release:<br>
<br>
<a href="http://tinyurl.com/8axmckc" target="_blank">http://tinyurl.com/8axmckc</a><br>
<br>
If you could test the latest github code and report back whether it<br>
fixes the issue for you or not that&#39;d be very helpful.<br>
<br>
~Justin<br>
<div class="im"><br>
On 01/18/2012 03:44 PM, Paul Koerbitz wrote:<br>
&gt; Hi Justin,<br>
&gt;<br>
&gt; thanks for the fast response and the great work. I thought about<br>
&gt; taking a crack at a fix myself, but Im not familiar with the<br>
&gt; codebase and don&#39;t have very little time right now.<br>
&gt;<br>
&gt; thanks Paul<br>
&gt;<br>
&gt; On Wed, Jan 18, 2012 at 21:33, Justin Riley &lt;<a href="mailto:jtriley@mit.edu">jtriley@mit.edu</a><br>
</div><div><div class="h5">&gt; &lt;mailto:<a href="mailto:jtriley@mit.edu">jtriley@mit.edu</a>&gt;&gt; wrote:<br>
&gt;<br>
&gt; Hi Paul,<br>
&gt;<br>
&gt; I just tested for myself and I can confirm that /etc/exports is<br>
&gt; indeed being clobbered when running the &#39;addnode&#39; command. I&#39;m<br>
&gt; working on a patch release to fix this and other minor things.<br>
&gt; Should be out tomorrow.<br>
&gt;<br>
&gt; Thanks for reporting!<br>
&gt;<br>
&gt; ~Justin<br>
&gt;<br>
&gt; On 01/18/2012 02:08 PM, Paul Koerbitz wrote:<br>
&gt;&gt; Dear starcluster team,<br>
&gt;<br>
&gt;&gt; I tripped over what might be an error with the NFS setup when<br>
&gt;&gt; adding new nodes to a cluster.<br>
&gt;<br>
&gt;&gt; I set up my cluster with initially one root node only and then<br>
&gt;&gt; first added one node and subsequently 4 more nodes. I noticed<br>
&gt;&gt; that my ebsvolume wasn&#39;t getting mounted correctly on the nodes,<br>
&gt;&gt; calling &#39;df&#39; reported &#39;stale filehandle&#39; for /home /opt/sge6 and<br>
&gt;&gt; /data<br>
&gt;<br>
&gt;&gt; My impression is that as nodes get added, the /etc/exports file<br>
&gt;&gt; which is responsible for allowing NFS access gets overwritten.<br>
&gt;&gt; Therefore only the last added node can access the shared file<br>
&gt;&gt; systems.<br>
&gt;<br>
&gt;&gt; Here is how I resloved the issue. First I unmounted all the<br>
&gt;&gt; volumes:<br>
&gt;<br>
&gt;&gt; root@node001:~# umount -f /data<br>
&gt;<br>
&gt;&gt; At this point remounting doesn&#39;t work:<br>
&gt;<br>
&gt;&gt; root@node001:~# mount -t nfs master:/data /data<br>
&gt;<br>
&gt;&gt; mount.nfs: access denied by server while mounting master:/data<br>
&gt;<br>
&gt;<br>
&gt;&gt; I then edited /etc/exports on the master node. Here only the<br>
&gt;&gt; last node was listed:<br>
&gt;<br>
&gt;&gt; /home node005(async,no_root_squash,no_subtree_check,rw)<br>
&gt;&gt; /opt/sge6 node005(async,no_root_squash,no_subtree_check,rw)<br>
&gt;&gt; /data node005(async,no_root_squash,no_subtree_check,rw)<br>
&gt;<br>
&gt;&gt; I changed this to /home<br>
&gt;&gt; node001(async,no_root_squash,no_subtree_check,rw) /opt/sge6<br>
&gt;&gt; node001(async,no_root_squash,no_subtree_check,rw) /data<br>
&gt;&gt; node001(async,no_root_squash,no_subtree_check,rw) /home<br>
&gt;&gt; node002(async,no_root_squash,no_subtree_check,rw) /opt/sge6<br>
&gt;&gt; node002(async,no_root_squash,no_subtree_check,rw) /data<br>
&gt;&gt; node002(async,no_root_squash,no_subtree_check,rw) /home<br>
&gt;&gt; node003(async,no_root_squash,no_subtree_check,rw) /opt/sge6<br>
&gt;&gt; node003(async,no_root_squash,no_subtree_check,rw) /data<br>
&gt;&gt; node003(async,no_root_squash,no_subtree_check,rw) /home<br>
&gt;&gt; node004(async,no_root_squash,no_subtree_check,rw) /opt/sge6<br>
&gt;&gt; node004(async,no_root_squash,no_subtree_check,rw) /data<br>
&gt;&gt; node004(async,no_root_squash,no_subtree_check,rw) /home<br>
&gt;&gt; node005(async,no_root_squash,no_subtree_check,rw) /opt/sge6<br>
&gt;&gt; node005(async,no_root_squash,no_subtree_check,rw) /data<br>
&gt;&gt; node005(async,no_root_squash,no_subtree_check,rw)<br>
&gt;<br>
&gt;&gt; then restart the nfs-server:<br>
&gt;<br>
&gt;&gt; $ /etc/init.d/nfs-kernel-server restart<br>
&gt;<br>
&gt;&gt; After that running &#39;df&#39; on each node showed the nfs now working<br>
&gt;&gt; correctly.<br>
&gt;<br>
&gt;&gt; kind regards Paul<br>
&gt;<br>
&gt;<br>
&gt;&gt; This body part will be downloaded on demand.<br>
&gt;<br>
&gt;<br>
&gt;<br>
<br>
-----BEGIN PGP SIGNATURE-----<br>
Version: GnuPG v2.0.17 (GNU/Linux)<br>
Comment: Using GnuPG with Mozilla - <a href="http://enigmail.mozdev.org/" target="_blank">http://enigmail.mozdev.org/</a><br>
<br>
</div></div>iEYEARECAAYFAk8XRPwACgkQ4llAkMfDcrlJWACgjNwy6KVMywbiP6aVggOgQVqm<br>
OD8AnA/1fwt04oGIhEtA7i3kq8KLMr0y<br>
=9mnL<br>
-----END PGP SIGNATURE-----<br>
_______________________________________________<br>
StarCluster mailing list<br>
<a href="mailto:StarCluster@mit.edu">StarCluster@mit.edu</a><br>
<a href="http://mailman.mit.edu/mailman/listinfo/starcluster" target="_blank">http://mailman.mit.edu/mailman/listinfo/starcluster</a><br>
</blockquote></div><br></div>