[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Google (und ein Beispiel aus der Praxis)



Vom Retrievalsystem her war Google lange Zeit gar nicht so ausgefeilt
wie beispielsweise Altavista, viele Features wurden erst nach und nach
ergänzt und Boolesche Operatoren sind immer noch nicht richtig
implementiert, siehe z.B. Greg Notess' "Review of Google"

http://www.searchengineshowdown.com/features/google/index.shtml

Aber seine große Stärke, die es trotz dieser Unzulänglichkeiten für
viele Zwecke zur besseren Suchmaschine machte, war halt das Citation
Ranking, daß der selbstreferentiellen Natur wissenschaftlicher
Kommunikationsprozesse Rechnung trägt. 

Wenn Arms Google als Alternative zu INSPEC nennt, bezieht er sich als
Informatiker natürlich auf den Computer Sciences Part der Datenbank. Für
die Physik ist INSPEC keineswegs überflüssig, zumal auch Google nicht
das "Deep Web" indexiert, geschweige denn z.B. arxive.org, vor dem ein
Schild steht "Hier dürfen Robots nicht hinein". 

Seine Stärke ist das Ranking und natürlich inzwischen der große Index
(was wohl in den ersten Tagen - ich war Betanutzer - niemand erwartet
hatte, ist längst erreicht: Google hat die anderen Suchmaschinen
inzwischen auch in Hinblick auf die Zahl der indexierten Dokumente
überholt. 

Dabei ist Google ja noch ein relativ "dummes" System, das keine
"semantische" Analyse von Texten vornimmt und so schrittweise das Netz
von Verlinkungen (auch ohne das der ursprüngliche Text HTML-Links
enthält) weiterausbaut, bruchstückhafte Identifizierungen automatisch
komplettiert etc. wie der Research-Index das macht. 

Trotzdem ist Google auch jetzt schon auch für Informationsspezialisten
ein wunderbares Werkzeug, weil sich Recherchen nach dem Schneeballsystem
hier bisweilen sehr schnell und effizient durchführen lassen (ich sage
bisweilen, weil ich sehr schnell ein Gefühl dafür bekomme, ob ich bei
einem bestimmten Problem mit Google weiterkomme oder nicht), und - ganz
wichtig - weil es sich spielerisch als "Assoziationsmaschine" benutzen
läßt, um eine anfangs unzulängliche Recherchestrategie schnell zu
verbessern (die "richtige" Terminologie aus den wenigen relevanten
Dokumenten in den Top ten extrahieren) oder auch gezielt auf ganz neue,
anfangs nicht vorhersehbare Wege zu bringen (das "Unerwartete" suchen
und damit weiterrecherchieren.*) 

Z.B. habe ich damit in sehr kurzer Zeit zusammen mit einem Klienten eine
sehr umfassende Recherche über Literatur zum "elastischen Pendel"
gemacht, ein Modellsystem nichtlinearer Dynamik. Das funktionierte so
wunderbar, weil eine Reihe von Schlüsselarbeiten online waren (nicht
unbedingt alle frei, aber halt hier in Stuttgart lizenziert), diese
zahlreiche Literaturhinweise enthielten und das Eingeben der Titel und
des ersten Autors älterer von diesen Arbeiten nach dem Prinzip des
Science Citation Index über Google wieder neue relevante Arbeiten zu
Tage förderten, die diese zitierten. Einige dieser Arbeiten waren
neueren Datums und tauchten im Web of Science von ISI gar nicht auf. Und
die Recherche gab nicht nur Zeitschriftenaufsätze, sondern auch
Computersimulationsprogramme und Java-Applets, die auch für den Einsatz
in Lehrveranstaltungen geeignet sind. Natürlich würde man dieses Thema
trotzdem noch in INSPEC, MathSCI und MATH nachrecherchieren, wenn man an
Einzelaspekten genauer interessiert ist, aber ein besserer und
schnellerer Einstieg wäre nicht zu finden gewesen. Das vor allem
deswegen, weil Google interdisziplinär ist und dieses so simple
physikalische Modell eine ungeahnte Komplexität und Anwendungsbreite
hat. 

Damit das jetzt nicht so theoretisch bleibt, hier als Link noch die
Arbeit aus jüngster Zeit, die sich als Key paper herausstellte (wußten
Sie, daß sich die typischen Wetterverhältnisse, mit denen Irland
"gesegnet" ist, mit einer Analogie zum System des Federpendels (Swinging
Spring) beschreiben lassen?):

Lynch, Peter, 2001: The Swinging Spring: a Simple Model for Atmospheric
Balance. PostScript or PDF file. 
To appear in Proceedings of the Symposium on the Mathematics of
Atmosphere-Ocean Dynamics. Isaac Newton Institute, June-December, 1996
[sic!]. Cambridge University Press. Abstract (HTML).
http://www.maths.tcd.ie/~plynch/SwingingSpring/Papers.html

Auf der Homepage des Autors,
http://www.maths.tcd.ie/~plynch/TCD_Home_Page.html

gibt es eine faszinierende Applet-Seite zum Federpendel. Viel Spaß!

P.S.: Aus Erfahrung weiß ich, daß der Background eines
Informationsspezialisten und erfahrenen Rechercheurs (ob es sich nun um
"Reference Librarians" amerikanischer Prägung oder Fachreferenten
handelt, die in der täglichen Praxis Informationsvermittlung in der IVS
oder anderen IuD-Einrichtungen haben) gegenüber einem "normalen"
Klienten auch im Handling solcher Werkzeuge wie Google (als einem von
vielen Werkzeugen, die wir routinemäßig benutzen, wozu auch die Suche
über Schlagwortketten und Systematikgruppen im Online-Katalog gehört,
siehe die in meiner letzten Mail zitierten Ausführungen von Thomas Mann
(d.J. ;-)) unschätzbare Vorteile bringt. Ich habe also kein Problem
damit und halte es nicht für "unter meiner Würde", auch mit einem
zahlenden Industriekunden erstmal eine Vorabrecherche im frei
zugänglichen Google zu machen (und auch nochmal im Katalog
nachzuschauen). Die sind meist baß erstaunt, was da alles rauszuholen
ist, selbst wenn sie es selbst vorher schon probiert haben. Das hat das
den Vorteil (vor allem auch für Studenten und Wissenschaftler, für die
wir Recherchen machen), daß sie daraus auch etwas für den täglichen
Gebrauch abschauen können. Daß die freie Zugänglichkeit des  Werkzeugs
(Google) allein nicht ausreicht, zeigen auch die vielen Fragen, die in
der Mailingliste Rabe mit dessen Hilfe beantwortet werden: viele
Fragesteller kennen Google selbst, aber finden trotzdem nicht den
richtigen Dreh. Es braucht eben doch noch den schlauen Raben und das
"Gewußt wie" (manchmal nur eine triviale Abwandlung der Fragestellung
oder die richtige Assoziation). 

Bernd-Christoph Kämper, UB Stuttgart

*) Wobei die konzeptionell schwierigste Suche wohl die ist,
Gegenpositionen zu einer bestimmten These herauszufiltern oder Artikel,
die ein Konzept für eine "schlechte Idee" halten, weil Werturteile mit
"dummen" Suchmaschinen so schwer zu identifizieren sind. Zitierungen und
Ko-Zitierungen helfen auch da ein ganzes Stück weiter, aber das
Mitdenken können Sie nicht ersetzen ...
 
Hans Hehl wrote:
> 
> Zur Diskussion betreffend Google möchte ich noch ergänzen, daß Google auf
> Grund seines ausgefeilten Systems vor allem auch teuren bibliographischen
> Datenbanken Konkurrenz machen kann, was auch für Bibliotheken interessant
> sein könnte . So heißt es in dem von Herrn Kaemper zitierten Aufsatz von
> W-Y.Arms (im Hinblick auf Google im Vergleich mit Inspec): "Google is more
> up to date than Inspec, its coverage is broader and its indexing records are
> good enough for me to find what I am looking for. But its greatest strength
> is that everything in its indexes is available online with open access." Das
> letztere ist das Wesentliche.
> 
> Mit freundlichen Grüßen
> 
> Hans Hehl
> Kurt Schumacher Str 25
> 93049 Regensburg
> Tel. 0941 34980
> E-Mail: johannes.hehl _at__ bibliothek.uni-regensburg.de
> 
> -----Ursprüngliche Nachricht-----
> Von: kaemper _at__ ub.uni-stuttgart.de <kaemper _at__ ub.uni-stuttgart.de>
> An: Internet in Bibliotheken <INETBIB _at__ ub.uni-dortmund.de>
> Datum: Dienstag, 14. August 2001 17:04
> Betreff: Re: Citation Indexing (Google for books)
> 
> [Lieber Herr Eversberg, nein, ich nehme Ihnen die Frotzelei natürlich
> nicht übel. Andererseits ließ sie mich natürlich auch nicht ruhen ;-)
> Ich hatte diese Antwort gestern geschrieben, sie aber noch
> zurückgehalten, weil ich sehen wollte, ob denn noch jemand anders etwas
> dagegenhält ;-) Den Citeseer hatte ich in meiner Mail ja schon erwähnt
> und weitere Hinweise folgen hier. Herzlichst, ihr B.C.K.]
> 
> Lieber Herr Eversberg,
> 
> umgekehrt wird ein Schuh draus: wenn Bibliotheken einen
> Entwicklungszustand, in dem ein "Google for Books" eine
> Selbstverständlichkeit ist (und sei es als "Abfallprodukt"), nicht
> wenigstens als Vision anstrebten, dann wäre das auf Dauer die
> Bankrotterklärung der Profession. Aber vielleicht muß man bloß den Fokus
> verschieben: es wird natürlich kein "Google for Books" sein, sondern
> sinnvollerweise ein "Google also for Books", denn in dem Maße wie Bücher
> online oder Ersatzrepräsentationen für Bücher (Surrogate,
> Metadata-wrapper) digital aufbereitet werden (z.B. durch Extraktion von
> Inhaltsverzeichnissen, Abstracts und References, zusätzlich zu den aus
> Katalogaufnahmen zu gewinnenden Standard-Metadaten, vgl. die aktuelle
> Diskussion über das "Academic Metadata Format") werden diese
> automatischen Analyse und Matching-Verfahren genauso zugänglich wie bei
> anderer Online-Literatur auch. So etwas nur auf Verbundebene zu
> realisieren, dürfte allerdings in der Tat vergeudete Zeit sein.
> 
> Ich nehme diese Liste als Forum, in dem auch so etwas wie Brainstorming
> möglich sein sollte, und dazu gehört, daß Ideen einfach in den Raum
> geworfen werden können, ohne sie gleich darauf überprüfen zu müssen, ob
> sie "realisierbar" sind. Meine hingeworfene Bemerkung war also im selben
> Sinne wie die von Karl Dietz gemeint.
> 
> Und mein in Anführungsstrichen gesetztes "nur noch" deutete schon an,
> daß ich den Vorschlag für nicht ganz realistisch halte, solange man sich
> im Rahmen des Status quo gängiger Bibliothekskataloge bewegt.
> 
> Noch einige Literaturhinweise in diesem Zusammenhang auf einige gewiß
> provokante Aufsätze:
> 
> A Universal Citation Database as a Catalyst for Reform in Scholarly
> Communication / by Robert D. Cameron
> in: First Monday (1997) Vol. 2 No. 4, Apr. 1997,
> http://www.firstmonday.dk/issues/issue2_4/cameron/index.html
> 
> (Der Autor ist Informatiker, nicht Bibliothekar und kennt offensichtlich
> nicht die lange Tradition, die Versuche, eine "Universal Bibliographic
> Control" zu erreichen, im Bibliothekswesen haben. Aber Bibliothekare
> haben auch blinde Flecken...)
> 
> Automated Digital Libraries
> How Effectively Can Computers Be Used for the Skilled Tasks of
> Professional Librarianship? / William Y. Arms, Cornell University, in:
> D-Lib Magazine Vol. 6, Number 7/8, July/August 2000
> http://www.dlib.org/dlib/july00/arms/07arms.html
> 
> Und einige Zitate zum Citation Indexing:
> (Ich gebe z.T. statt der eigentlichen URL die Citeseer-Seite an, weil
> man solche Systeme dann gleich in Aktion sehen kann ...)
> 
> Automatic Extraction of Reference Linking Information from Online
> Documents
> Cornell University Technical Report, TR 2000-1821, November 2000
> http://www.cs.cornell.edu/cdlrg/Reference%20Linking/extraction.pdf
> 
> Publications: Digital Libraries and Citation Indexing - Steve Lawrence
> http://www.neci.nj.nec.com/homepages/lawrence/pub-dl.html
> 
> Developing services for open eprint archives: globalisation, integration
> and the impact of links (2000) / Steve Hitchcock, Les Carr, Zhuoan Jiao,
> Donna Bergmark*, Wendy Hall, Carl... ACM DL
> http://citeseer.nj.nec.com/hitchcock00developing.html
> 
> und als Beispiel für die Repräsentation von Zitaten zu Online-Katalogen
> im Citeseer empfehle ich eine Suche nach Zitaten und Arbeiten von
> Michael Buckland (OASIS ...). Wenn Sie Metadaten vermissen, können Sie
> die selbst nachtragen (ein Horror? Wird aber schon auf Plausibilität
> geprüft ...), z.B. The Online Catalog: From Technical Services to Access
> Service (1993)
> http://citeseer.nj.nec.com/126584.html
> 
> Spannend auch die
> 
> Bicentennial Conference on Bibliographic Control for the New Millenium:
> Confronting the challenges of Networked Resources and the web
> http://www.loc.gov/catdir/bibcontrol/
> 
> Hierin gibt es interessante Beiträge (jeweils von unabhängiger Seite
> kommentiert) zum "Library Catalog and the Web" und zum Thema "Exploring
> "Partnerships: What Can Producers and Vendors Provide". Ich empfehle
> allerdings als Antidot zu möglicherweise aufkommenden falschen
> Erwartungen auch den Beitrag eines dedizierten "Abweichlers" aus der LoC
> zu lesen, nämlich den von Thomas Mann:
> 
> Is Precoordination Unnecessary in LCSH? Are Web Sites More Important to
> Catalog than Books? : A Reference Librarian's Thoughts on the Future of
> Bibliographic Control
> 
> Noch eine andere unausgegorene Idee, natürlich nicht so gut wie ein
> richtiges Citation Web ...
> Starten Sie eine Anfrage im OPAC, füttern Sie die Trefferliste (Autoren
> mit Titel und evtl. Verlag, evtl. mit Kriterium NEAR falls die
> Suchmaschine dies anbietet) in einen geeigneten Webindex (schnelle
> Antwortzeit ist wichtig, Google erfüllt diese Bedingung) und nehmen Sie
> die (natürlich unscharfe) Trefferzahl der Suchmaschine als (ein
> mögliches) Rankingkriterium, evtl. mit einer Korrektur für den Parameter
> "Sprache": englisch-sprachige Titel sind im Web bevorzugt vertreten.
> 
> Bei Web-PACs könnte sehr nützlich sein ein Button, der mit dem Kurztitel
> eines Buches eine Google-Suche startet und so relevante Seiten findet,
> die ein Buch zitieren (also "related webpages", worunter natürlich auch
> Webseiten für das Buch selbst, Reviews etc. sein können). Ich benutze
> dies ständig, z.B. wenn ich mal schnell herausfinden will, ob ein zur
> Anschaffung anstehendes Lehrbuch (die neu eingeführten Master of Science
> Studiengänge lassen grüßen ...) schon eine Webseite hat oder irgendwo
> empfohlen wird, oder um andere relevante Literatur zu finden, wenn ich
> feststelle, daß die Literatur zu einem bestimmten Forschungszweig
> unterrepräsentiert ist (Neubesetzungen von Lehrstühlen ...).
> 
> Bemerkenswerterweise ist die Bibliothek in Gent
> (SFX/OpenURL-Miterfinder) diese Idee noch (nicht gehabt oder) nicht
> realisiert; dort gibt es nur den üblichen Button, mit dem dieselbe Suche
> im Web (Google) oder in Newsgroup (ebenfalls Google) angestoßen wird.
> 
> Gruß in meine alt-junge Praktikumsbibliothek!
> Bernd-Christoph Kämper
> 
> Bernhard Eversberg wrote:
> >
> > Es ist ja richtig, was Kollege Kaemper da schreibt:
> >
> > > Ein entscheidendes Kriterium fehlte in der Liste von Karl Dietz,
> naemlich
> > > das Hauptkritierium, welches Google fuer's Ranking benutzt: die
> > > Haeufigkeit, mit der der betreffende Titel zitiert wird.
> > >
> > aber das Erfassen der Zitate und ihr korrektes Verknuepfen mit den
> > vorhandenen Titelsaetzen duerfte nun wirklich komplett aussichtslos
> > sein.  So etwas auch nur in den Bereich des Moeglichen zu ruecken,
> > haette man gerade von Kaemper nicht erwartet... Das weckt vollkommen
> > unerfuellbare Vorstellungen. Aber vielleicht muessen wir auch immer
> > mal deutlich sagen, was alles NICHT geht.
> >
> > Richtig ist nur, dass die anderen Kriterien wohl kaum eine
> > vergleichbare Wirksamkeit entfalten wuerden, selbst wenn man sie
> > allesamt realisieren KOENNTE. Ein Label "Google for books" waere
> > mithin Hochstapelei.
> >
> > MfG B.E.
> >
> > Bernhard Eversberg
> > Universitaetsbibliothek, Postf. 3329,
> > D-38023 Braunschweig, Germany
> > Tel.  +49 531 391-5026 , -5011 , FAX  -5836
> > e-mail  B.Eversberg _at__ tu-bs.de


Listeninformationen unter http://www.inetbib.de.