<HTML><HEAD>
<META content="text/html; charset=iso-8859-15" http-equiv=Content-Type>
<META name=GENERATOR content="MSHTML 8.00.6001.18852"></HEAD>
<BODY style="MARGIN: 4px 4px 1px; FONT: 10pt Microsoft Sans Serif">
<DIV>Anyone have any ideas please?</DIV>
<DIV>&nbsp;</DIV>
<DIV>
<P><FONT face=Arial>Vrywaringsklousule / Disclaimer: </FONT><U><A href="http://www.nwu.ac.za/it/gov-man/disclaimer.html"><FONT color=#0000ff face=Arial>http://www.nwu.ac.za/it/gov-man/disclaimer.html </FONT></A></U></P><BR><BR>&gt;&gt;&gt; On 03 November 2009 at 12:40 PM, "Louw Venter" &lt;Louw.Venter@nwu.ac.za&gt; wrote:<BR></DIV>
<DIV style="BORDER-LEFT: #050505 1px solid; BACKGROUND-COLOR: #ebebeb; MARGIN: 0px 0px 0px 15px; PADDING-LEFT: 7px">
<DIV>Hello&nbsp;all,</DIV>
<DIV>&nbsp;</DIV>
<DIV>I made a bit of a mess. </DIV>
<DIV>A while back I uploaded some PDF documents to DSpace and ran Filter media to extract the text. Recently the creators of the pdf files sent me a batch with updated volume numbers etc to replace the existing ones already on the server. So I simply removed the items and added new bitstreams.</DIV>
<DIV>Now when I run the filter media process again the text doesn't get extracted - could this be because the checksums don't match or because the original&nbsp;was located in one assetstore and the new one in another?</DIV>
<DIV>&nbsp;</DIV>
<DIV>Thank you in advance for any help in this regard,</DIV>
<DIV>&nbsp;</DIV>
<DIV>&nbsp;</DIV>
<DIV>ERROR filtering, skipping bitstream:</DIV>
<DIV>&nbsp;</DIV>
<DIV>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Item Handle: 10394/1886<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Bundle Name: ORIGINAL<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; File Size: 287223<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Checksum: 6de2597a7cabd6ca3a995c355d9301f1 (MD5)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Asset Store: 1<BR>java.lang.NullPointerException<BR>java.lang.NullPointerException<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.pdfbox.pdmodel.PDPageNode.getAllKids(PDPageNode.java:194)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.pdfbox.pdmodel.PDPageNode.getAllKids(PDPageNode.java:182)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.pdfbox.pdmodel.PDDocumentCatalog.getAllPages(PDDocumentCatalog.java:226)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.pdfbox.util.PDFTextStripper.writeText(PDFTextStripper.java:216)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.dspace.app.mediafilter.PDFFilter.getDestinationStream(PDFFilter.java:141)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.dspace.app.mediafilter.MediaFilterManager.processBitstream(MediaFilterManager.java:668)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.dspace.app.mediafilter.MediaFilterManager.filterBitstream(MediaFilterManager.java:570)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.dspace.app.mediafilter.MediaFilterManager.filterItem(MediaFilterManager.java:520)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.dspace.app.mediafilter.MediaFilterManager.applyFiltersItem(MediaFilterManager.java:488)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.dspace.app.mediafilter.MediaFilterManager.applyFiltersAllItems(MediaFilterManager.java:427)<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.dspace.app.mediafilter.MediaFilterManager.main(MediaFilterManager.java:359)</DIV>
<DIV>&nbsp;</DIV>
<DIV>&nbsp;</DIV>
<DIV>Louw Venter</DIV></DIV></BODY></HTML>