[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Dublin Core und AltaVista



(Resent from Wed, 04 Feb 1998 16:51:48 +0100)

Thomas Hilberer schrieb:
> M.a.W.: eine der besten und meistgebrauchten Suchmaschinen kann mit 
> den DC nichts anfangen.
> Stimmt das, oder wo liegt mein Fehler?

Der Fehler liegt nicht bei Ihnen, Herr Hilberer, sondern bei den globalen Suchdiensten.
Diese koennen naemlich nicht nur mit Dublin Core, sondern auch mit allen anderen
standardgebundenen Metadaten nichts anfangen.
(vgl. zu anderen Metadatenstandards: A review of metadata: a survey of current 
esource description formats, EU Project DESIRE at: http://www.ukoln.ac.uk/metadata/desire/overview/ )
Diese Dienste haben die breite Masse der Nutzer auf globaler Ebene und die
Maximierung der Werbeeinnahmen zum Ziel und prioritieren daher bisher eher
grosse Treffermengen als praezise Suchresultate.
Sobald ein oder einige wenige Metadatenstandards im Netz verstaerkt genutzt
werden oder die kommerzielle Konkurrenz sich auch auf kleinere kaufstarke
Spezialinteressen erstreckt werden auch die globalen Dienste standardisierte Metadaten
indexieren und fuer die Suche zugaenglich machen.

Metadaten werden im Augenblick in verschiedener Weise indexiert von den globalen
Diensten Alta Vista, Infoseek, Hotbot und WebCrawler, von SwissSearch und den
deutschen Diensten Fireball, Aladin und Eule, vom Nordic Web Index und einigen
anderen.

Das Indexieren der Metadaten ist aber nur eine Vorraussetzung guter 
Suchmoeglichkeiten. Wichtiger ist, welche Metadaten indexiert werden und vor
allem, ob sie detailliert gesucht werden koennen. Auf einzelne Metadatenfelder/
-kategorien zu begrenzende Suche wird nur von SwissSearch, Nordic Web Index,
Fireball, Polish academic webindex,Energysearch und der australischen HotMeta 
Search Engine angeboten.
Nur Hotbot und Infoseek (konnte noch nicht bewiesen werden) geben bei Treffern
in Metadaten ein etwas hoeheres Ranking-Gewicht.
Wichtig ist auch, ob und wie Metadaten im Ergebnis einer Suche angezeigt werden.

> Wenn es stimmt, ist es dann derzeit sinnvoll, Dokumente nach den DC 
> zu indexieren bzw. NUR nach den DC?

Wie oben angedeutet, kann das Huhn-Ei Problem nur aufgeloest werden, wenn
vermehrt standardgebundene Metadaten ins Netz gebracht werden. Dann 
wird auch eine Anpassung der globalen Dienste folgen. Viel eher aber, teilweise
schon jetzt, bereiten regionale und fachspezifische robot-basierte Dienste das
Indexieren und Suchen in Metadaten vor. Vor allem werden von vielen groesseren
Projekten standardgebundene Metadaten produziert (und zunaechst intern 
genutzt). (vgl. z. B. nur eine der Sammlung von Beschreibungen von Dublin Core
Projekten bei: http://linnea.helsinki.fi/meta/projects.html )

Wie die Entwicklung von Dublin Core verdeutlicht hat, sind Metadaten in bis zu
15 verschiedenene Attributkategorien als ein Core Set anzusehen und die
Begrenzung auf keywords und description, wie heute bei den erwaehnten
Diensten, greift fuer viele Zwecke zu kurz.

Es ist daher zu empfehlen, standardgebundene Metadaten, ausserhalb von
Fachbereichen, die andere ausfuehrliche Metadatenstandards nutzen, nach
Dublin Core mit Hilfe von existierenden Metadata creator templates zu
generieren. Wer keywords braucht, die nicht im body text enthalten sind 
und/oder seine eigene Seitenzusammenfassung (bis zu maximal 1024 Zeichen 
in der Regel) publiziert sehen moechte, muss heute die DC Informationen nochmal in
eigene META Felder fuer diese Dienste kopieren.

Was die Moeglichkeiten des Missbrauchs angeht, haben die grossen Suchdienste
das mittlerweise ganz gut in den Griff bekommen. Bei Metadaten gesteuerter
Suche wird man die Anzahl der gleichen Woerter in einem bestimmten Feld 
sicher nicht zur Ergebnisgewichtung heranziehen. Ein intellektuell vergebenes
Stichwort wird das Dokument nicht besser beschreiben, wenn es mehrmals
wiederholt wurde. Kein mir bekannter Metadaten Suchdienst rangordnet
Treffer aus Metadatenfeldern.

Gruesse,
Traugott Koch
-- 
+-------------------------------------------------------------+
| TRAUGOTT KOCH,    Electronic information services librarian |
|  LUND UNIVERSITY LIBRARY, Development Department NetLab,    |
|  P.O. Box 3.  S-221 00  Lund, Sweden                        |
| Tel: int+46 46 2229233    Fax: int+46 46 2223682 or 2224422 |
| E-mail: traugott.koch _at__ ub2.lu.se                             |
| Personal homepage: http://www.ub2.lu.se/koch.html           |
+-------------------------------------------------------------+




Listeninformationen unter http://www.inetbib.de.