[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: (Fwd) Re: Anreicherung von Katalogen / dandelon.com



On 23 Jun 04, at 18:53, Walther Umstätter wrote:

> Nichts gegen Bardot, aber in allen statistischen Fragen Sagen Computer
> grundsätzlich nur vielleicht.
>
Nein! Auch dies ist wieder eine euphemistisch-metaphorische Sichtweise.
Sie geben Zahlen aus, und der menschliche Betrachter interpretiert diese als
"vielleicht". Das ist was anderes! Die Zahlen ergeben sich in jedem Fall aus
einer langen Sequenz von Ja-Nein-Entscheidungen, das "vielleicht" ergibt sich
erst auf einer höheren Ebene außerhalb des Rechners. Und wenn man
einprogrammiert, dass er innerhalb bestimmter Grenzen eben das Wort
"vielleicht"
ausgeben soll, heißt das noch keineswegs, dass er was verstanden hat. Er hat
nur
die Frage, ob der Wert zwischen den Grenzen liegt, beantwortet, und zwar mit
"ja".

> Ansonsten lässt sich der Paradigmenwechsel vom Determinismus des
> Laplaceschen Dämons,
> hin zu dem rein wahrscheinlichkeitstheoretischen des Maxwellschen Dämons
> nirgends so genau verfolgen,
> wie in der Informationstheorie, die ja auf den Erkenntnissen zur
> Entropie beruht.
... und ganz falsch benannt ist, weil sie sich eben nicht mit Information im
landläufigen Sinne befasst, sondern mit der Übermittlung von Nullen und
Einsen
und den dabei auftretenden Fehlern. Eins der schlimmsten Beispiele fuer eine
euphemistische Metapher.

> ... können Indexierer, mit einem guten Thesaurus das semantische
> Problem durchaus abmildern,
> wenn sie im Thesaurus eine klare Begrifflichkeit schaffen und,
> gleichgültig ob ein Autor von einem Register, einem Index, einem
> Inhaltsverzeichnis,
> einer Wortliste, einer Datei oder einem Directory schreibt,
> "inverted file" indexen, wenn es sich um einen solchen handelt.
>
> Das ist ein wichtiger Teil der Qualitätssicherung in Bildung und
> Wissenschaft,
> um die sich Bibliotheken schon immer gekümmert haben,
> wenn sie inhaltlich (also begrifflich) zusammengehöriges auswählten und
> zusammenbrachten.

So ist es. Anreicherungen der beschriebenen Art können das unterstützen, aber
sie
erhöhen neben dem recall leider auch die imprecision. Doch Google-gegerbte
Sucher
kennen es nicht anders.

Das führt aber zu der Überlegung, dass man in angereicherten Katalogen
unbedingt
die  Möglichkeit braucht, die "normalen" Titelaufnahmedaten und Schlagwörter
getrennt abfragen zu können, und daß diese auch nicht qualitiativ nachlassen
dürfen. Sonst würde man bei Millionenmengen zu oft mit allzu großen
Ergebnismengen überschüttet, wenn man nur den einen Einwurfschlitz für
undifferenzierte Wortmünzen hätte.

MfG B.E.



Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329,
D-38023 Braunschweig, Germany
Tel.  +49 531 391-5026 , -5011 , FAX  -5836
e-mail  B.Eversberg@xxxxxxxx


Listeninformationen unter http://www.inetbib.de.