[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: google for books :: Re: AW: [Inetbib] Informationsmanag



Ein entscheidendes Kriterium fehlte in der Liste von Karl Dietz, nämlich
das Hauptkritierium, welches Google für's Ranking benutzt: die
Häufigkeit, mit der der betreffende Titel zitiert wird. 

Wenn schon ganze Inhaltsverzeichnisse von Monographien für
Bibliothekskataloge gescannt worden sind, warum nicht auch gleich noch
die Literaturverzeichnisse? Dann müssten die betreffenden
Literaturstellen "nur noch" mit den zugehörigen Titelstammsätzen
verknüpft werden und man hätte ein selbstreferentielles System, aus dem
man eine(n Teil der) Metrik für das Ranking gewinnen könnte (das heißt
nicht, daß die anderen genannten Parameter nicht auch brauchbar seien).
Science Citation Index und Citeseer,
http://www.neci.nec.com/homepages/lawrence/citeseer.html (Autonomous
Citation Indexing-Projekt der NEC Research Institutes) trennen auch
nicht zwischen Monographien und Zeitschriften.

Gruß,
B.-C. Kämper, UB Stuttgart

Bernhard Eversberg wrote:
> 
> Am 10 Aug 2001, um 16:37 hat Michael Schaarwaechter
> geschrieben:
> >
> >
> > > Betrachten wir doch mal Google: Bei einer wesentlich vielschichtigeren
> > > und groesseren Datenmenge liefert diese Suchmaschine in den meisten
> > > Faellen mit einem (!!!) Suchfeld befriedigende Ergebnisse...
> > >
> > > Bitte nicht missverstehen: Ich moechte nicht Google als Bibl.-Katalog
> > > einsetzen. Aber _aequivalent_ einfache Loesungen - das waer's doch.
> >
> "Einfach" heisst hier: einfach fuer den Endbenutzer. Technisch ist
> Google wohl die komplizierteste Suchmaschine ueberhaupt. Einfachheit
> suggeriert eine keineswegs vorhandene Problemlosigkeit und eine
> noch weniger vorhandene Verlaesslichkeit.
> 
> Karl Dietz hatte dazu einige Ideen, die er ungeachtet der
> technischen Umsetzungsmoeglichkeiten aussprach:
> Nachfolgend ein paar Gedanken zu eben jenen Moeglichkeiten.
> >
> > moegliche
> > rankingoptionen fuer kataloge
> >
> > auflagenhoehe des buches. simmel for president :)
> >
> Die Aufl.Hoehe ist i.d.R. nicht erfasst und auch selten dem Buch
> zu entnehmen. Hier fehlt also voellig die Datengrundlage.
> 
> >
> > auflagenanzahl
> > (also zb psycherembel liegt recht weit oben wenn nach
> > medizinischen woerterbuechern gesucht wird)
> >
> Das waere ein Ansatzpunkt, wenngleich da nicht immer eine verwertbare
> Zahl in den Katalogdaten steht. Aber die Tatsache, DASS es eine
> Auflagenzahl gibt, waere auch schon verwertbar.
> 
> >
> > automatische auswertung von bestsellerlisten
> > zb spiegel, swr, ...
> >
> Fuer wissenschaftliche Literatur nicht relevant, fuer den OeB-Bereich
> waere es denkbar. Aber "automatische Auswertung"? Die ISBN steht da
> i.A. nicht drin, und die Namens- und Titelansetzung in den Listen
> erlaubt nicht immer eine automatische Zuordnung zu
> Bibliotheksdatensaetzen. Muesste man genauer untersuchen. Erfasst die
> ekz solche Dinge?
> >
> > verlagswertung: zb piper bekommt viele punkte. verlage bei denen
> > die autoren bezahlen muessen, eher weniger (oder gar
> > minuspunkte:)
> >
> Dazu muesste man eine Normdatei der Verlage haben (existiert noch
> nicht) und die Verlagsnamen normiert erfassen. Fuer RAK2 ist das
> auch geplant, aber bisher sind die Namen nur in Vorlageform erfasst,
> die bekanntlich stark schwankt. Das groessere Problem duerfte die
> Zuordnung einer Bewertungsziffer zu jedem Verlag sein! Wer soll
> das machen? Das waere jedoch eine moegliche Einnahmequelle, nebenbei
> gesagt... (1 Mio im Jahr fuer die hoechste Ziffer waere wohl
> angemessen)
> 
> >
> > taschenbuchwertung. buecher, die als tb auch erscheinen sind
> > hoeher zu ranken als nur hardcover
> >
> Die Daten geben das nicht her: es gibt keine Verknuepfung zwischen
> den Saetzen fuer Hardcover und Paperback. Muesste also erst erfasst
> werden, wobei die Altdaten dann rausfallen.
> 
> >
> > webwertung. buecher im web sind doch was, auch wenn sie den vier-
> > B-test nicht bestehen (was'n das fuer 'n test??) (bett, badezimmer,
> > beach und... faellt mir grad nicht ein)
> >
> Noch schwieriger. Die Web-Titel muessten erst geeignet erfasst werden.
> 
> >
> > ausleihwertung. buecher die oft ausgeliehen werden, werden hoeher
> > bewertet
> Das laesst sich schwer in eine Verbunddatenbank einbringen, und
> gerade in solchen wuerde man das Ranking dringender brauchen als
> in Lokalkatalogen. Schon im Lokalsystem ist es aber nicht leicht, weil
> i.d.R. die Ausleihdaten in eigenen Tabellen stehen, nicht in den
> Titeldaten. Hinzu kommt das Problem der Mehrfachexemplare. DASS es
> solche gibt, waere aber auch ein Kriterium.
> Nur durch aufwendige, erst noch zu programmierende, periodisch
> stattfindende Auswertungsroutinen koennte man die Datengrundlage
> gewinnen. Unmoeglich waere das nicht, uninteressant auch nicht
> aber recht aufwendig.
> >
> > sprachenwertung. buecher, die in vielen sprachen vorliegen sind
> > hoeher zu bewerten als andere.
> >
> Auch dies ist nicht erfasst. Es gibt zwar den "Einheitstitel", der
> ausweist, DASS das Buch eine Uebersetzung ist (nur dies waere
> unmittelbar verwertbar), doch man hat keine datentechnische
> Verknuepfung mit dem Satz des Originaltitels (der u.U. gar nicht
> existiert). Nirgends ist in den Daten die Tatsache ablesbar, dass das
> Buch "in vielen Sprachen vorliegt". Per (zu schreibendem) Programm
> koennte man viele solche Faelle finden, aber auch dieses Programm
> muesste dann periodisch laufen - oder man muesste die Tatsache als
> solche eigens erfassen. Aber wie? Dem vorliegenden Buch sieht man
> es nicht an.
> 
> Notwendig waeren also mehrere ganz unterschiedliche Massnahmen, um
> ueberhaupt eine Datengrundlage fuer ein wirkungsvolles Ranking
> zu gewinnen - technische Massnahmen, aber auch Aenderungen der
> Katalogisierungsregeln. Vorsicht ist generell geboten, wenn man ein
> Kriterium nur fuer einen kleineren Teil der Titel feststellen koennte.
> Dann waere das Ranking Etikettenschwindel.
> Nachzudenken ist auch in diesem Zusammenhang ueber Sinn und Aufgaben
> der Kataloge. RAK 101 ist die einzige Stelle, wo etwas dazu steht,
> und was da steht, muss ohnehin endlich mal ueberdacht werden (das
> sage ich hier nicht zum ersten Mal).
> Nicht guenstig waere es, wenn solche Massnahmen in einem Katalog
> realisiert wuerden, in anderen aber nicht oder anders. Dann waere die
> Einheit des Katalogwesens endgueltig dahin. Mag sein, dass das ausser
> uns niemanden stoeren wuerde. Wollen wir klare Konturen des
> Bibliothekswesens in der Oeffentlichkeit? Das geht nur mit einer
> gewissen Einheitlichkeit im Erscheinungsbild und in den
> Angeboten. Was OPACs anbelangt, sieht es da jetzt schon nicht
> besonders gut aus.
> 
> MfG B.E.
> Bernhard Eversberg
> Universitaetsbibliothek, Postf. 3329,
> D-38023 Braunschweig, Germany
> Tel.  +49 531 391-5026 , -5011 , FAX  -5836
> e-mail  B.Eversberg _at__ tu-bs.de


Listeninformationen unter http://www.inetbib.de.