[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Syntax von Suchanfragen: best practices



Hallo Herr Prante,

vielen Dank für die Bemerkungen.

On 13.08.2012 19:09, Jörg Prante wrote:
die übliche Art und Weise für die Suche nach speziellen Symbolen wie '*'
ist das Einschliessen in Hochkommata.

Beispiel Googlesyntax:

"a* algorithm"
"b+-trees"


Ich habe das mal kurz exemplarisch in verschiedenen Systemen ausprobiert 
(Primo, Summon, VuFind) und festgestellt, dass es hier offenbar keine 
einheitliche Behandlung gibt. In den meisten Fällen bekomme ich auch "a 
algorithm …" bzw. "b trees" als Suchtreffer ausgegeben (ich habe jeweils 
die Titelsuche gewählt, um auszuschließen, dass der Hit irgendwo im TOC, 
Abstract oder Volltext enthalten ist).

Beste Grüße,
Sascha Szott


Dabei kann die dahinter liegende Suchmaschine sich aussuchen, ob
innerhalb einer Phrase die Wörter als mittel- oder unmittelbare Folge
gematcht werden ("sloppy phrasing"), oder bei einem nicht randständigem
'*'-Symbol eine Mittentrunkierung durchgeführt wird ("wildcard infix
operator"), oder andere Mechanismen greifen (etwa Proximitätssuche,
Lucene bietet z.B. sog. "span queries" an).

Sollte die gezielte Suche nach Wörtern gewünscht sein, die sowohl aus
Buchstaben als auch aus speziellen Symbolen (wie *, +, -, Interpunktion
usw.) bestehen, so muss die Suchmaschine zunächst dazu gebracht werden,
die gewünschten Symbole auch tatsächlich zu indexieren (die normalen
Lucene-Analyzer tun dies nämlich nicht). Danach kann dann in
Suchanfragen das zu suchende Symbol mit einem vorangestellten
linksseitigen Schrägstrich ("backslash")  angegeben werden. Eine
Dokumentation ist zu empfehlen, denn es ist nicht zu erwarten, dass jede
Benutzerin oder jeder Benutzer die speziellen Symbole auswendig kennt.
Siehe auch
http://lucene.apache.org/core/3_6_1/queryparsersyntax.html#Escaping%20Special%20Characters

Viele Grüße

Jörg Prante


-- 
Sascha Szott :: KOBV/ZIB :: <szott@xxxxxx> :: +49 30 84185-457


-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.