[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

AW: (Fwd) Re: Anreicherung von Katalogen / dandelon.com



Herr Eversberg schrieb:

"Das führt aber zu der Überlegung, dass man in angereicherten Katalogen
unbedingt die  Möglichkeit braucht, die "normalen" Titelaufnahmedaten und
Schlagwörter getrennt abfragen zu können, und daß diese auch nicht qualitiativ
nachlassen dürfen. Sonst würde man bei Millionenmengen zu oft mit allzu großen
Ergebnismengen überschüttet, wenn man nur den einen Einwurfschlitz für
undifferenzierte Wortmünzen hätte."

Die Bedeutung der normalen Titelaufnahmen ist natürlich enorm wichtig. Sie
sind und bleiben dss Fundament. Wir haben diesem Umstand bisher dadurch
Rechnung getragen, dass in dandelon die Gewichte der bibliographischen
Elemente (Titel, Schlagwort) so gesetzt sind bzw. gesetzt sein sollten (muss
noch verstärkt werden), dass Dokumente, in denen solche Elemente "greifen"
immer top gereiht sein müssten. Daneben existiert ja noch der "normale"
Bibliothekskatalog.
Doch auch in dandelon sind die Kategorien streng getrennt. Das geht bis in die
Metainformationen der Schlagwörter (Länderkennungen, Zeitcodes,...) hinein.
Wir könnten jederzeit eine zusätzliche sogenannte "Profisuche" realisieren mit
Kategorienauswahl und beliebigen Kombinationsmöglichkeiten (auch der
Metainformationen).
Der primäre Benutzerbedarf war aber zunächst eine einfache "Google"-Suche mit
angereicherten rechercheaktiven (den eingeschränkten Horizont des
Aleph-Kataloges überschreitenden) Informationen als zusätzliches Angebot zum
Bibliothekskatalog.

Bei Rechercheanfragen, die aus zumindest 2 Suchbegriffen bestehen, sind
natürlich insbesondere die Treffer ein enormer Zugewinn, in denen nur ein
Suchbegriff oder eine Teilmenge in den Titel- bzw. Schlagwörtern greift. Damit
können bestimmte Detailaspekte einer Thematik gezielt und mit hoher Relevanz
recherchiert werden.
Bei Suchanfragen, die aus mehreren Suchtermen bestehen, recherchiert dandelon
ja nach default mit der "Phrasensuche" bei einem Null-Trefferresultat (Anzahl
der Treffer ist definierbar) wird automatisch auf das "AND" umgeschaltet. In
diesen Fällen könnte es durchaus sinnvoll sein, im ersten Schritt (oder
überhaupt) nur Treffer anzuzeigen, die entweder zumindest einen Suchbegriff in
den Titelrelevanten Daten (Autor, Titel, Schlagwort...) enthalten oder im
selben Satz bzw. Absatz des Dokumentes (TOC, Volltext) vorkommen. Damit hätte
man Fehlverknüpfungen radikal reduziert.

Zur entbrannten "Intelligenz"-Diskussion:
Natürlich halte ich dandelon nicht in diesem Sinne für intelligent. Das ganze
sollte eigentlich unter dem Aspekt der Suche nach einem "griffigen" Namen (wie
nenne ich das Kind) gesehen werden. "dandelon" könnte sozusagen als Pseudonym
oder Künstlername verstanden werden, da sich das Kind mit seinem Namen selbst
nicht ganz anfreunden konnte.

Die Motivation von Herrn Eversberg, mit dem Begriff "Intelligenz" sorgsammer
und sensibler umzugehen, teile ich in vollem Umfang. Die Literatur in diesem
Zusammenhang strotzt vor Anthropomorphismen, die menschliche, bewußte Einsicht
in scheinbar wissenschaftlich definierte Begriffsbildungen (unter
Überschreitung des wissenschaftlichen Rahmens) hineininterpretiert. Wirkliche
Intelligenz ist für mich an Einsicht als bewußte Wahrnehmung geknüpft, die
erst Überschreitungen des Rahmens und wirkliche Kreativität ermöglicht.
Ich möchte nur hinweisen auf:
Penrose, Roger: Computerdenken : des Kaisers neue Kleider oder die Debatte um
Künstliche Intelligenz, Bewußtsein und die Gesetze der Physik. Heidelberg :
Spektrum-d.-Wiss.-Verl.-Ges., 1991.

Mit freundlichen Grüßen,
Karl Rädler




-----Ursprüngliche Nachricht-----
Von: owner-inetbib@xxxxxxxxxxxxxxxxxx
[mailto:owner-inetbib@xxxxxxxxxxxxxxxxxx] Im Auftrag von Bernhard Eversberg
Gesendet: Donnerstag, 24. Juni 2004 09:52
An: Internet in Bibliotheken
Betreff: Re: (Fwd) Re: Anreicherung von Katalogen / dandelon.com

On 23 Jun 04, at 18:53, Walther Umstätter wrote:

> Nichts gegen Bardot, aber in allen statistischen Fragen Sagen Computer
> grundsätzlich nur vielleicht.
>
Nein! Auch dies ist wieder eine euphemistisch-metaphorische Sichtweise.
Sie geben Zahlen aus, und der menschliche Betrachter interpretiert diese als
"vielleicht". Das ist was anderes! Die Zahlen ergeben sich in jedem Fall aus
einer langen Sequenz von Ja-Nein-Entscheidungen, das "vielleicht" ergibt sich
erst auf einer höheren Ebene außerhalb des Rechners. Und wenn man
einprogrammiert, dass er innerhalb bestimmter Grenzen eben das Wort
"vielleicht"
ausgeben soll, heißt das noch keineswegs, dass er was verstanden hat. Er hat
nur die Frage, ob der Wert zwischen den Grenzen liegt, beantwortet, und zwar
mit "ja".

> Ansonsten lässt sich der Paradigmenwechsel vom Determinismus des
> Laplaceschen Dämons, hin zu dem rein wahrscheinlichkeitstheoretischen
> des Maxwellschen Dämons nirgends so genau verfolgen, wie in der
> Informationstheorie, die ja auf den Erkenntnissen zur Entropie beruht.
... und ganz falsch benannt ist, weil sie sich eben nicht mit Information im
landläufigen Sinne befasst, sondern mit der Übermittlung von Nullen und Einsen
und den dabei auftretenden Fehlern. Eins der schlimmsten Beispiele fuer eine
euphemistische Metapher.

> ... können Indexierer, mit einem guten Thesaurus das semantische
> Problem durchaus abmildern, wenn sie im Thesaurus eine klare
> Begrifflichkeit schaffen und, gleichgültig ob ein Autor von einem
> Register, einem Index, einem Inhaltsverzeichnis, einer Wortliste,
> einer Datei oder einem Directory schreibt, "inverted file" indexen,
> wenn es sich um einen solchen handelt.
>
> Das ist ein wichtiger Teil der Qualitätssicherung in Bildung und
> Wissenschaft, um die sich Bibliotheken schon immer gekümmert haben,
> wenn sie inhaltlich (also begrifflich) zusammengehöriges auswählten
> und zusammenbrachten.

So ist es. Anreicherungen der beschriebenen Art können das unterstützen, aber
sie erhöhen neben dem recall leider auch die imprecision. Doch Google-gegerbte
Sucher kennen es nicht anders.

Das führt aber zu der Überlegung, dass man in angereicherten Katalogen
unbedingt die  Möglichkeit braucht, die "normalen" Titelaufnahmedaten und
Schlagwörter getrennt abfragen zu können, und daß diese auch nicht qualitiativ
nachlassen dürfen. Sonst würde man bei Millionenmengen zu oft mit allzu großen
Ergebnismengen überschüttet, wenn man nur den einen Einwurfschlitz für
undifferenzierte Wortmünzen hätte.

MfG B.E.



Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329,
D-38023 Braunschweig, Germany
Tel.  +49 531 391-5026 , -5011 , FAX  -5836 e-mail  B.Eversberg@xxxxxxxx


Listeninformationen unter http://www.inetbib.de.