Search exact terms

classic Classic list List threaded Threaded
4 messages Options
Reply | Threaded
Open this post in threaded view
|

Search exact terms

Tim Mahy
Hi all,

is there a Solr wide setting that with which I can achieve the following :

if I now search for q=onderwij, I also receive documents with results of "onderwijs" etc.. this is ofcourse the behavior that is described but if I search on "onderwij", I still get the "onderwijs" hits, I use for this field the type "text" from the schema.xml that is supplied with the default Solr.

Is there a global setting on Solr to always search Exact ?

Greetings,

Tim





Info Support - http://www.infosupport.com

Alle informatie in dit e-mailbericht is onder voorbehoud. Info Support is op geen enkele wijze aansprakelijk voor vergissingen of onjuistheden in dit bericht en staat niet in voor de juiste en volledige overbrenging van de inhoud hiervan. Op al de werkzaamheden door Info Support uitgevoerd en op al de aan ons gegeven opdrachten zijn - tenzij expliciet anders overeengekomen - onze Algemene Voorwaarden van toepassing, gedeponeerd bij de Kamer van Koophandel te Utrecht onder nr. 30135370. Een exemplaar zenden wij u op uw verzoek per omgaande kosteloos toe.

De informatie in dit e-mailbericht is uitsluitend bestemd voor de geadresseerde. Gebruik van deze informatie door anderen is verboden. Openbaarmaking, vermenigvuldiging, verspreiding en/of verstrekking van deze informatie aan derden is niet toegestaan.

Dit e-mailbericht kan vertrouwelijke informatie bevatten. Indien u dit bericht dus per ongeluk ontvangt, stelt Info Support het op prijs als u de zender door een antwoord op deze e-mail hiervan op de hoogte brengt en deze e-mail vervolgens vernietigt.
Reply | Threaded
Open this post in threaded view
|

Re: Search exact terms

Umar Shah
If you want this behavior then the field type should not be 'text'.
for default fieldtype=text there are many filters applied before the values
are indexed, this includes stemming (reducing the word to root word,
removing s in ur case.

try using fieldtype=string instead. this will match strictly to the values
in the field (exact match, case sensitive)

try tweaking schema.xml in the conf folder .

you can tweak the definition in this file to be able to use delimiter/ case
filters as seems fir for your case.


-umar


2008/4/2 Tim Mahy <[hidden email]>:

> Hi all,
>
> is there a Solr wide setting that with which I can achieve the following :
>
> if I now search for q=onderwij, I also receive documents with results of
> "onderwijs" etc.. this is ofcourse the behavior that is described but if I
> search on "onderwij", I still get the "onderwijs" hits, I use for this field
> the type "text" from the schema.xml that is supplied with the default
> Solr.
>
> Is there a global setting on Solr to always search Exact ?
>
> Greetings,
>
> Tim
>
>
>
>
>
> Info Support - http://www.infosupport.com
>
> Alle informatie in dit e-mailbericht is onder voorbehoud. Info Support is
> op geen enkele wijze aansprakelijk voor vergissingen of onjuistheden in dit
> bericht en staat niet in voor de juiste en volledige overbrenging van de
> inhoud hiervan. Op al de werkzaamheden door Info Support uitgevoerd en op al
> de aan ons gegeven opdrachten zijn - tenzij expliciet anders overeengekomen
> - onze Algemene Voorwaarden van toepassing, gedeponeerd bij de Kamer van
> Koophandel te Utrecht onder nr. 30135370. Een exemplaar zenden wij u op uw
> verzoek per omgaande kosteloos toe.
>
> De informatie in dit e-mailbericht is uitsluitend bestemd voor de
> geadresseerde. Gebruik van deze informatie door anderen is verboden.
> Openbaarmaking, vermenigvuldiging, verspreiding en/of verstrekking van deze
> informatie aan derden is niet toegestaan.
>
> Dit e-mailbericht kan vertrouwelijke informatie bevatten. Indien u dit
> bericht dus per ongeluk ontvangt, stelt Info Support het op prijs als u de
> zender door een antwoord op deze e-mail hiervan op de hoogte brengt en deze
> e-mail vervolgens vernietigt.
>
Reply | Threaded
Open this post in threaded view
|

Re: Search exact terms

Ryan McKinley
In reply to this post by Tim Mahy
search is based on the fields you index and how you index them.

If you index using the "text" field -- with stemming etc, you will  
have to search with the same criteria.

If you want exact search, consider the "string" type.  If you want  
both, you can use the <copyField> to copy the same content into  
multiple fields so it is searchable multiple ways

ryan



On Apr 2, 2008, at 4:46 AM, Tim Mahy wrote:

> Hi all,
>
> is there a Solr wide setting that with which I can achieve the  
> following :
>
> if I now search for q=onderwij, I also receive documents with  
> results of "onderwijs" etc.. this is ofcourse the behavior that is  
> described but if I search on "onderwij", I still get the "onderwijs"  
> hits, I use for this field the type "text" from the schema.xml that  
> is supplied with the default Solr.
>
> Is there a global setting on Solr to always search Exact ?
>
> Greetings,
>
> Tim
>
>
>
>
>
> Info Support - http://www.infosupport.com
>
> Alle informatie in dit e-mailbericht is onder voorbehoud. Info  
> Support is op geen enkele wijze aansprakelijk voor vergissingen of  
> onjuistheden in dit bericht en staat niet in voor de juiste en  
> volledige overbrenging van de inhoud hiervan. Op al de werkzaamheden  
> door Info Support uitgevoerd en op al de aan ons gegeven opdrachten  
> zijn - tenzij expliciet anders overeengekomen - onze Algemene  
> Voorwaarden van toepassing, gedeponeerd bij de Kamer van Koophandel  
> te Utrecht onder nr. 30135370. Een exemplaar zenden wij u op uw  
> verzoek per omgaande kosteloos toe.
>
> De informatie in dit e-mailbericht is uitsluitend bestemd voor de  
> geadresseerde. Gebruik van deze informatie door anderen is verboden.  
> Openbaarmaking, vermenigvuldiging, verspreiding en/of verstrekking  
> van deze informatie aan derden is niet toegestaan.
>
> Dit e-mailbericht kan vertrouwelijke informatie bevatten. Indien u  
> dit bericht dus per ongeluk ontvangt, stelt Info Support het op  
> prijs als u de zender door een antwoord op deze e-mail hiervan op de  
> hoogte brengt en deze e-mail vervolgens vernietigt.

Reply | Threaded
Open this post in threaded view
|

RE: Search exact terms

Lance Norskog
This is confusing advice to a beginner. A string field will not find a
word in the middle of a sentence.

To get normal searches without this confusions, copy the 'text' type and
make a variant without the Stemmer. The problem is that you are using an
English language stemmer for what appears to be Dutch. There is a Dutch
stemmer, it might be better for your needs if the content is all Dutch.

To make an exact search field which still has helpful searching
properties, make another variant of text that breaks up words but does
not stem. You might also want to add the ISOLatin1 filter which maps all
European characters to USASCII equivalents. This is also very helpful
for multi-language searching.

Lance

-----Original Message-----
From: Ryan McKinley [mailto:[hidden email]]
Sent: Wednesday, April 02, 2008 7:06 AM
To: [hidden email]
Subject: Re: Search exact terms

search is based on the fields you index and how you index them.

If you index using the "text" field -- with stemming etc, you will have
to search with the same criteria.

If you want exact search, consider the "string" type.  If you want both,
you can use the <copyField> to copy the same content into multiple
fields so it is searchable multiple ways

ryan



On Apr 2, 2008, at 4:46 AM, Tim Mahy wrote:
> Hi all,
>
> is there a Solr wide setting that with which I can achieve the
> following :
>
> if I now search for q=onderwij, I also receive documents with results
> of "onderwijs" etc.. this is ofcourse the behavior that is described
> but if I search on "onderwij", I still get the "onderwijs"
> hits, I use for this field the type "text" from the schema.xml that is

> supplied with the default Solr.
>
> Is there a global setting on Solr to always search Exact ?
>
> Greetings,
>
> Tim
>
>
>
>
>
> Info Support - http://www.infosupport.com
>
> Alle informatie in dit e-mailbericht is onder voorbehoud. Info Support

> is op geen enkele wijze aansprakelijk voor vergissingen of
> onjuistheden in dit bericht en staat niet in voor de juiste en
> volledige overbrenging van de inhoud hiervan. Op al de werkzaamheden
> door Info Support uitgevoerd en op al de aan ons gegeven opdrachten
> zijn - tenzij expliciet anders overeengekomen - onze Algemene
> Voorwaarden van toepassing, gedeponeerd bij de Kamer van Koophandel te

> Utrecht onder nr. 30135370. Een exemplaar zenden wij u op uw verzoek
> per omgaande kosteloos toe.
>
> De informatie in dit e-mailbericht is uitsluitend bestemd voor de
> geadresseerde. Gebruik van deze informatie door anderen is verboden.
> Openbaarmaking, vermenigvuldiging, verspreiding en/of verstrekking van

> deze informatie aan derden is niet toegestaan.
>
> Dit e-mailbericht kan vertrouwelijke informatie bevatten. Indien u dit

> bericht dus per ongeluk ontvangt, stelt Info Support het op prijs als
> u de zender door een antwoord op deze e-mail hiervan op de hoogte
> brengt en deze e-mail vervolgens vernietigt.