[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Antw: RE: dandelon.com und andere Browser als IE - Nebenschauplatz



Liebe/r Frau/Herr Kirn, lieber Herr Rädler, liebe Listenmitglieder!

Helge Knüttel schrieb:
> > Beispiele zum Nachvollziehen:
> >
> > - Suche nach "München": Bereits der vierte Treffer
> > kommt durch den Verlagsort an diese Stelle, nicht
> > weil sich das Werk mit München befaßt. Andere
> > Treffer tauchen auf, weil Autoren aus München
> > stammen. Da ist, bei aller sonstigen Krtitik, ein
> > herkömmlicher OPAC besser.
> >
> > - Suche nach "Bibliothek": Durch das mitgescannte
> > Barcodeetikett der besitzenden Bibliothek mit der
> > Aufschrift "Vlbg. Landesbibliothek" der erste
> > "falsche" Treffer bereits an fünfter Stelle,
> > zahlreiche weitere falsche in den insgesamt 631
> > Treffern nicht viel später und aus demselben Grund.
>
S. Kirn schrieb:
> Nun, da muss man aber dem Anwender der Suchmaschine
> eine nicht unerhebliche "Mitschuld" ankreiden. Denn
> die beiden obigen Begriffe sind nunmal
> "Allerweltswörter".
>
> Sie haben vielleicht bei der Suche anhand dieser
> Stichworte ein bestimmtes Ergebnis im Kopf, aber das
> kann der Rechner niemals erraten, da sie dem Rechner
> nicht alle relevanten Informationen mitteilen. Da
> helfen auch keine noch so ausgefeilten Algorithmen.
> Denn selbst ein Mensch könnte diese Aufgabe nicht
> erfüllen.
>

Von einer "intelligenten Suche" erwarte ich mir natürlich Treffer, die
inhaltlich dem Suchbegriff entsprechen. Das war eine Prämisse, mit der ich an
die Suche ging. Das ist doch außerdem die Motivation, neue Suchstrategien -
und methoden zu entwerfen.

Wenn ich nach Werken über Bibliotheken recherchiere möchte ich doch nicht den
Gesamtbestand aller Bibliotheken als Trefferliste erhalten, nur weil der
Besitzerstempel oder ein Barcodeetikett mitgescannt wurden (Das ist bei
dandelon natürlich nicht so extrem der Fall!). Das ist ein Fehler der
ausgemerzt gehört. Herr Rädler berichtete, daß bereits daran gearbeitet wird.

Das Problem auf "Allerweltswörter" zu schieben ist mir zu einfach. Eine Stärke
von Systemen wie dandelon ist doch, bei der Eingabe von "Bibliothek" auch
Werke zu finden, die sich inhaltlich damit auseinandersetzen, aber den String
Bibliothek nicht im Titel oder gar nirgends stehen  haben (z.B. weil sie
englisch sind) und außerdem vielleicht auch Werke auszusortieren, die zwar
"Bibliothek" im Text haben, aber inhaltlich nichts damit zu tun haben (weil
dies etwa nur Teil einer Adressangabe ist).

Herr Rädler schrieb ja, daß dandelon an der Vorarlberger Landesbibliothek
neben dem OPAC als _zusätzliche_ Recherchemöglichkeit für die schwierigen
Fälle gedacht ist und daß an der Parametrisierung der Recherche und der
Relevanzsortierung gearbeitet wird. Dann hört sich die von ihm erläuterte
Suchstrategie sehr vielversprechend an.

Vielleicht wir es ja zukünftig bei dadelon bei der Indexierung Mechanismen
geben, Adressen und andere formale Angaben herauszusortieren, die nicht
wirklich zur Inhaltsbeschreibung des Werks beitragen. Die METAe engine
<http://meta-e.aib.uni-linz.ac.at/> soll ja schon einiges bei der Erkennung
solcher Angaben leisten.

Karl Rädler schrieb:
> Mir scheint der Focus insbesondere von Bibliothekaren zu sehr
> "fehlerzentriert" zu sein.  Weniger bis nicht relevante Treffer werden
> tendenziell höher bewertet als die vielen relevanten, die sonst nicht
> aufgefunden hätten werden können. Ich glaube, dass das "Ranking" auch
> in dieser Beziehung nachjustiert werden müsste.
>

Vielleicht werden die Chancen der neuen Technologien tatsächlich noch nicht
genug gesehen. Wenn ich mir allerdings schon bei einem kleinen Korpus bereits
aus 631 Treffern die relevanten selbst heraussuchen muß, wie wird es dann erst
mit Millionen von erfaßten Dokumenten? War meine Überlegung. Wenn natürlich
wie angekündigt die Algorithmen optimiert werden, sollten die Vorteile des
Systems mehr zum Tragen kommen. Oder bei anderen Fragestellungen.

Beste Grüße
Helge Knüttel



----
Dr. rer. nat. Helge Knüttel
Fachreferat Medizin, Informationsvermittlung Biomedizin
Universitätsbibliothek Regensburg
D-93042 Regensburg, Germany
email: helge.knuettel@xxxxxxxxxxxxxxxxxxxxxxxxxxxx
phone: ++49 941 944-5937; fax:   ++49 941 944-5938


Listeninformationen unter http://www.inetbib.de.