<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:"Arial Unicode MS";
        panose-1:2 11 6 4 2 2 2 2 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:"\@Arial Unicode MS";
        panose-1:2 11 6 4 2 2 2 2 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EN-AU link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal>Can anyone confirm my understanding of how DSpace performs keyword
indexing/searching? I suspect that it is doing automatic mapping of singular and
plural forms of words.<o:p></o:p></p>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal>How I came to this understanding was as follows.<o:p></o:p></p>

<p class=MsoNormal>I was searching for an item authored by Alys (alternate
spelling of Alice) Clark.<o:p></o:p></p>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal>I retrieved three items none of which had the word alys in the
metadata or bitstream.&nbsp; If I searched for alys on its own I got 168 hits
and a cursory glance at the results list showed that they all had an author
with some part of their name being ali.<o:p></o:p></p>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal>I then tried searching for each of the following forms<span
style='font-family:"Arial","sans-serif"'><o:p></o:p></span></p>

<p class=MsoNormal><span style='font-family:"Arial","sans-serif"'>aly, ali,
alis, alys alies <o:p></o:p></span></p>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal>All of these as single search terms retrieved exactly the
same number of records &#8211; 168.&nbsp; Results included items with the following
strings in Abstract<o:p></o:p></p>

<p class=MsoNormal><u><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black;background:yellow;mso-highlight:yellow'>- ALIS</span></u><span
style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";color:black'>
(Advanced Landmine Imaging System), which is a novel landmine detection sensor
system<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'>- Current ventilatory practices for the management of <u><span
style='background:yellow;mso-highlight:yellow'>ALI</span></u> favor low tidal
volumes<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'>- Current Trends in Periodontal Diagnosis &amp; Disease
Recognition in Malaysia / T.B. Taiyeb <u><span style='background:yellow;
mso-highlight:yellow'>Ali</span></u><o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'>- Radiology in the acute abdomen / P.G. Devitt, A. <u><span
style='background:yellow;mso-highlight:yellow'>Aly</span></u>, M. Thomas<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'>My conclusion is that DSpace is doing some process of mapping
plural to singular forms of words including allowing for alternate endings.&nbsp;
If it is doing this it is very clever but just a little annoying as Alys is not
the plural of Ali.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'>Also if clever enough to do this why can&#8217;t it map fiber to
fibre and color to colour which would have much greater benefits in searching a
database that includes North American and European data.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:9.5pt;font-family:"Arial Unicode MS","sans-serif";
color:black'>Cheers, </span><o:p></o:p></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto;
line-height:12.0pt'><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Vanessa
Barrett<br>
Digital Services Librarian<br>
The University of Adelaide, AUSTRALIA 5005<br>
Ph&nbsp;&nbsp;&nbsp; : +61 8 8303 4625<br>
e-mail: vanessa.barrett@adelaide.edu.au<br>
<br>
</span><span style='font-size:9.0pt;font-family:"Verdana","sans-serif"'>CRICOS Provider
Number 00123M<br>
-----------------------------------------------------------<br>
IMPORTANT: This message may contain confidential or legally privileged
information. If you think it was sent to you by mistake, please delete all
copies and advise the sender. For the purposes of the SPAM Act 2003, this email
is authorised by The University of Adelaide. <o:p></o:p></span></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto;
line-height:12.0pt'><span style='font-size:9.0pt;font-family:"Verdana","sans-serif"'>Think
green: read on the screen.<o:p></o:p></span></p>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

</div>

</body>

</html>