[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Suchmaschinen und Datenbanken



Am 16 Apr 2002, um 17:16 hat Heidrun Wiesenmueller geschrieben:

> Liebe Kolleginnen und Kollegen,
>
> ausnahmsweise mal *nicht* AACR, sondern eine Frage an die
> Suchmaschinen-Spezialisten:
>
> Ein unerfreulicher Nebeneffekt von Internet-Datenbanken besteht bekanntlich
> darin, dass deren Inhalt von Suchmaschinen nicht erfasst wird.

Das ist kein unerfreulicher Nebeneffekt, sondern so aufgesetzt
worden. Es besteht ein Unterschied zwischen Websites und
Internet-Datenbanken. Websites sind allgemein einsehbar und
werden von Suchmaschinen erfaßt. Internet-Datenbanken werden
meistens so aufgesetzt, daß sie von Suchmaschinen gar nicht
erfaßt werden können. Es ist ein technisches Problem.

> Wer
> beispielsweise mit Google nach 'Theodor Heuss' recherchiert, bekommt zwar
> Tausende von Treffern (darunter sicher auch einige sinnvolle), aber leider
> keinen Hinweis auf unsere Landesbibliographie, der er mit einer
> entsprechenden Recherche knappe biographische Angaben zu Heuss (und ca.
> 40.000 weiteren Persoenlichkeiten aus Baden-Wuerttemberg) sowie 58
> einschlaegige Treffer an Literatur ueber ihn entnehmen koennte.

Der Google-Algorithmus vergibt Gewichtungen an URLs. Ganz
oben stehen die Begriffe, die bei vorangegangenen Suchen am
häufigsten angeklickt wurden. Auf diese Weise gelingt es Google,
die wertvollsten Links ganz oben hinzustellen.

Leider - das ist die unangenehme Nachricht - ist Ihre
Landesbibliothek nicht die Referenz im weltweiten Web zu Theodor
Heuss aus der Sicht der Web-Surferinnen und -Surfer. Wenn ich
gezielt "'Württembergische Landesbibliothek Theodor Heuss"
eingebe, erhalte ich aber in Google einen Hinweis auf

http://www.lpb.bwue.de/heuss/heuss3.htm

Dieser ist Bestandteil Ihres Web-Auftritts und ordnungsgemäß
indexiert worden.

> Man koennte nun natuerlich parallel zur Datenbank HTML-Seiten anbieten
> (z.B. mit Registern oder ganzen virtuellen Druckbaenden), um das Problem zu
> umgehen (sowas machen z.B. die Kollegen in Rheinland-Pfalz).

Das Anbieten von HTML Seiten ist unbedingt zu empfehlen. Lokal
administrierte Datenbanken sind meistens zu langsam für Online-
Suchmaschinen. HTML Seiten lassen sich auf geeigneten Servern
sehr schnell generieren als auch durchsuchen, und über den Dublin
Core Meta Tag Standard können sie auch mit bibliothekarischen
Angaben versehen werden.

Um Mißverständnisse zu vermeiden: Google hat als HTML
Indexierer angefangen, und kann erst seit kurzem andere Nicht-
Web-Dateiformate wie PDF, DOC, PPT usw. Dublin Core kann es
leider auch nicht.

> Vielleicht
> gibt es aber auch andere Moeglichkeiten? Zumindest frage ich mich, wie es
> funktioniert, dass man praktisch immer auf das entsprechende Angebot bei
> Amazon kommt, wenn man den Titel eines beliebigen Buches in Google
> recherchiert.

Die Software-Entwickler bei Amazon haben die Amazon HTML
Seiten so programmiert, dass sie extrem schnell über die
angebotenen Produkte indexiert werden kann. Dahinter steckt kein
Geheimnis.

> Steckt da eine teuer bezahlte Vereinbarung zwischen Google
> und Amazon dahinter (in der Weise, dass bei jeder Google-Anfrage
> automatisch eine entsprechende Anfrage fuer die Amazon-Datenbank generiert
> wird) oder wird das technisch irgendwie anders geloest? Fuer Aufklaerung
> waere ich dankbar!

Nein. Google generiert keine Datenbank-Anfragen. Werbe-
Einblendungen werden ermöglicht, das funktioniert wie eine ganz
normale Anzeigenschaltung, nur übergibt Google den Suchbegriff
an den Werbepartner. Bei "Theodor Heuss", um bei dem Besipiel
zu bleiben, erhalte ich allerdings keine Bücherangebote von
Amazon eingeblendet.

Schöne Grüße

Jörg Prante

--
Jörg Prante
Software-Entwicklung Online-Fernleihe und Dokumentlieferdienste
Hochschulbibliothekszentrum NRW (HBZ)
Postfach 270451, 50510 Köln, Deutschland
Telefon +49-221-40075-407, Fax +49-221-40075-190
http://www.hbz-nrw.de/literatur/fernleihe


Listeninformationen unter http://www.inetbib.de.