[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Problem mit Google



Hallo allerseits,

Jörg Prante schrieb am 8 Feb 2005 um 22:23:

> nicht auf "Disallow:" angewiesen ist. Daher kann man den Googlebot
> auch einladen, bestimmte Bereiche oder Dateitypen einer Site zu
> durchsuchen - andere Suchmaschinen unterstützen das nicht. Eine
> Einladung für die ganze Site sähe so aus:

Ob sich Google wirklich an die robots.txt hält, wage ich zu
bezweifeln. Jedenfalls konnten wir Google - trotz entsprechendem
Eintrag in der robots.txt - nicht davon abhalten über 100.000 Seiten
aus unserer Systematik und aus unseren digitalisierten Drucken zu
indexieren. Die Seiten sind erst seit dem letzten Update von Google
(als die Indexgröße ganz plötzlich von 4 auf 8 Mrd. Seiten wuchs) im
Google-Index enthalten.

Um zum Problem-Beispiel zurückzukommen: Interessant ist, dass eine
Such nach "site:augustana.de" in der Trefferliste die Angabe "1-2 von
ungefähr 562" liefert. Google hat also die Web-Seiten evtl. doch noch
im Index, zeigt sie aber auch nach Ausschalten des Filters nicht an.
Allerdings sind die Trefferzahlen bei Google mit größter Vorsicht zu
genießen sind - dies zeigt der Artikel "Google's counts faked?" sehr
anschaulich. URL:
http://aixtal.blogspot.com/2005/01/web-googles-counts-faked.html

Viele Grüße

Sebastian Wolf

--
Sebastian Wolf, Universitätsbibliothek Bielefeld
- Elektronische Dienstleistungen (Digitale Bibliothek) -
Telefon: 0521 / 106-4044
E-Mail: sebastian.wolf@xxxxxxxxxxxxxxxx
http://www.ub.uni-bielefeld.de


Listeninformationen unter http://www.inetbib.de.