[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: inetbib-digest V1 #476 Re: Eversberg & Hoelzer - ein kleiner Retrieval-Vergleich



Liebe Liste,

Herr Eversberg bedauert, dass in LuMriX an der Uni Gießen das Wort
"Schuldrecht" offensichtlich in seine Kompositabestandteile zerschlagen
wird und kein gutes Recherchergebnis generiert (
http://geb.uni-giessen.de/geb/). Ich habe nachgetestet und finde dort
durchaus angemessene Titel von insgesamt 21, sehe die Kompositazerlegung an
diesem Beispiel nicht. Was aber den Einwand von Herrn Eversberg nicht
grundsätzlich entkräftet, denn deutsche Komposita sind extrem präzise
Begriffe, die durch Zerschlagung ihre Precission meist gänzlich verlieren.

Ich habe in http://www.dandelon.com den gleichen Suchterm verwendet -
automatisch wird dort daraus die Frage abgeleitet:
"schuldrecht" OR "Schadenersatz" OR "Sachschadenersatz" OR
"Obligationenrecht".
Die drei ersten Titel von insgesamt 65, sortiert nach Relevanz, passen
durchaus zum Thema, im Titel und in der Human-Indexierung fehlt jedoch
jeglicher Hinweis darauf. Die maschinelle Indexierung aus
intelligentCAPTURE hat den Effekt gebracht. 5. und 6. Titel - hier kommen
die maschinell ergänzten Suchworte - nicht aber das eingetippte
"Schuldrecht" in Titel und Human-Indexierung vor. usw.

Zweites Beispiel von Herrn Eversberg: "rechtspoltik" - geht bei LuMriX in
die Irre - schade. Richtig geschrieben sind die 4 Ergebnisse ein Startpunkt
für weiter Recherchen.
Die falsch geschriebene Version bringt in dandelon.com mit der
Suchstrategie "Most precission" keinen Treffer, zurecht, doch sehr wohl mit
der Strategie "Most recall", wo u.a. die Fuzzy-Search zugeschaltet ist und
dann auch richtig "Rechtspolitik" gefunden wird in einer Menge von 119
teils sehr einschlägigen Titeln. Ohne Schreibfehler wäre auf Anhieb

 "rechtspolitik" OR "Rechtsangleichung" OR "Rechtsvereinheitlichung" / most
 precission
 gesucht worden - mit einer Reihe von 38 meist einschlägigen Treffern.

 Ob die Titel von dandelon.com wirklich einschlägig genug sind, kann der
 Leser am sofort angezeigten Inhaltsverzeichnis prüfen.

 Dandelon.com hat derzeit 15.745 Titel - Giessen hat vermutlich deutlich
 mehr, kurfristig ermitteln konnte ich es nicht.
 Der Unterschied liegt im Indexierungsverfahren und in den
 Retrieval-Methoden.

 Kurzer Ausflug nach Bielefeld: "rechtpoltik" - kein Ergebnis, wohl aber
 mit korrekter Schreibweise. Gute Ergebnisse mit Schuldrecht. Retrieval mit
 Fast = siehe intelligenter Suchassistent.


 Mit freundlichem Gruß
 Manfred Hauer




AGI - Information Management Consultants
Dipl.-Inf.wiss. Manfred Hauer M.A.
Mandelring 238 b
67433 Neustadt / Weinstrasse
+49 6321 96 35 - 10
Manfred.Hauer@xxxxxxxxxx
http://www.agi-imc.de
http://www.dandelon.com


Listeninformationen unter http://www.inetbib.de.