[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Nachtrag: Suchformular zu "Das ungenutzte Potential von Standard-Suchmaschinen wie Google"



Hallo Herr Bewersdorff, liebe Liste,

Jörg Bewersdorff schrieb:

Für Interessenten habe ich das Google-Formular für ein paar Tage unter
http://www.bibliothek-pc.de/google.htm

Vielen Dank. Nun habe ich auch ein Beispiel gefunden, in der der der 
Volltext (PDF) eines von uns lizenzierten Springer-E-Books von Google 
komplett indexiert wurde. Beim Abruf des Treffers erhält man dann 
allerdings ggf. den Hinweis "Zugriff nur für Abonnenten", wenn man den 
Titel nicht lizenziert hat.

Ich gehe davon aus, dass die entsprechenden Content-Provider wie
Springer, Elsevier, Wiley, ..."einfach" die IP bzw. IPs des
Goolgebots nach "Herzenslust" durchsuchen lassen (die Browserkennung
auf Googlebot zu stellen reicht natürlich nicht!). Das heißt, der

Ja, so wird es sein. Dass Google Scholar so verfährt, dürfte bekannt 
sein. Bisher war ich aber davon ausgegangen, dass es eine strikte 
Trennung zwischen Google Scholar und Google gibt, aber vermutlich wurden 
auch Dokumente, die schon im Rahmen von Google Scholar indexiert wurden, 
in den allgemeinen Google-Index aufgeonmmen. Dies sieht man auch daran, 
dass bei den E-Book-Treffern bei Google die aus Google Scholar bekannte 
Trefferanzeige mit Anzahl der Zitate und Versionen erscheint, zudem 
Autor und Erscheinungsjahr. Allerdings frage mich, wieso es immer noch 
Unterschiede gibt zwischen Google und Google Scholar.

Beispiel. Die Suche nach
fünfdimensionale relativitätstheorie site:springerlink.com filetype:pdf
ergibt bei Google 5 Treffer, bei Google Scholar 7.

1 Treffer aus Google (der immerhin laut Google 162 mal zitiert wurde), 
ist nicht bei Google Scholar nachgewiesen. Umgekehrt sind 3 Treffer aus 
Google Scholar nicht bei Google nachgewiesen.

Vergleich der Trefferlisten:
http://www.google.com/search?q=f%C3%BCnfdimensionale+relativit%C3%A4tstheorie+site%3Aspringerlink.com+filetype%3Apdf
http://scholar.google.com/scholar?q=f%C3%BCnfdimensionale+relativit%C3%A4tstheorie+site%3Aspringerlink.com+filetype%3Apdf

Schon etwas merkwürdig. Sollte Google doch alles doppelt indexieren, 
einmal für Google allgemein und einmal für Google Scholar? Das wäre doch 
ziemlich unwirtschaftlich.

Yahoo und Bing verweisen bei einer Suche nach Titeln von 
Springer-E-Books übrigens nur auf die allgemeinen Infoseiten von 
Springer.com, von wo es lediglich die Möglichkeit gibt, das Buch zu 
kaufen. Dass Google hier viel mehr indexiert, wird auch bei den 
Trefferzahlen deutlich, auch wenn diese natürlich immer nur eine grobe 
Tendenz liefern. Eine Site-Suche nach "springerlink.com" bzw. eine 
zusätzliche Einschränkung auf PDFs ergibt bei:

Google: 4,5 Mio. Seiten (3,7 Mio. PDFs)
Bing:   27.000 Seiten (0 PDFs)
Yahoo:   7.000 Seiten (0 PDFs)

Google eignet sich also immer besser auch für die wissenschaftliche 
Literatursuche. Problematisch ist allerdings, dass die wiss. Dokumente 
bei einer allgemeinen Suche in der Masse der Treffer untergehen, zumal 
die indexierten Volltexte meist ein Page Rank von 0 haben und damit eher 
am Ende einer Trefferliste zu finden sind.

Viele Grüße

Sebastian Wolf

-- 
Sebastian Wolf : sebastian.wolf@xxxxxxxxxxxxxxxx
Uni-Bibliothek Bielefeld, Abt. Elektronische Dienstleistungen
Tel.:      +49 521 1064044
Website:   http://www.ub.uni-bielefeld.de/
Bookmarks: http://del.icio.us/bibliothekswelt/
Feeds:     http://www.bloglines.com/public/bibliothekswelt/

-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.