[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Dublin Core und AltaVista



Peter Seitz wrote:
>>Weil missbrauchlich in die META-Tags lauter
> > Stichwoerter reingeschrieben werden, manchmal zigfach dasselbe Wort 
> > hintereinander, um die Suchmaschine dazu zu bringen, das Dokument an den
> > entscheidenden Stellen ganz oben auf die "Relevanz"-Liste zu setzen...
> > Dadurch wird das eigentliche Ziel der Metadaten natuerlich voellig 
> > torpediert, aber noch weiss niemand, wie man dem begegnen soll.
> 
> Da muessten schon die Suchmaschinen so schlau sein und bei 
> mehrfachnennungen einfach die Mehrfachnennungen wegwerfen (ich weiss, 
> das ist einfacher gesagt als realisiert).

Wie ich in meiner Mitteilung schon andeutete haben einige der grossen Dienste
solche Anti-Spamming Massnahmen durchgefuehrt. Bei einigen dieser 
Dienste wird das META NAME=keywords Feld gar nicht bei der Berechnung
des Ranking/der Relevanz beruecksichtigt und verliert damit seinen Einfluss,
bei anderen werden die keywords wie gewoehnliche Worte im body Text
behandelt und erweitern eigentlich nicht die Manipulationsmoeglichkeiten.
Spezielle Metadaten nutzende Suchdienste suchen schon jetzt in den 
Metadatenfeldern mit Bool'scher Logik und rangordnen die Treffer aufgrund
dieser Metainformationen nicht nach der Frequenz der vorkommenden keywords.

> Nachdem das Thema aber hier schon angesprochen wurde, welche 
> Stichwoerter soll ich den - wenn ich solche definieren moechte - 
> verwenden? Gibt es da irgendwelche Richtlinien? In 
> Bibliothekskatalogen gibt es ja wohldefinierte Stichwortkataloge, 
> aber im Internet, einem chaotischen System?

Im Grossen und Ganzen stehen fuer Beschreibung von Internet die
gleichen Vokabularsysteme und Klassifikationen zur Verfuegung wie
fuer papiergebundene Dokumente.
Unser Dublin Core Metadaten Creator Formular unterstuetzt das in ganz
besonderem Masse. Auf der Hilfsseite fuer das Feld Subject 
(http://www.ub2.lu.se/metadata/subject-help.html) sind eine grosse
Anzahl solcher im Netz und als WWW-Seiten zugaenglicher Systeme
angeboten.
Javascript laedt diese Systeme in ein Hilfsfenster zum Navigieren, Waehlen
und Kopieren, wenn die Subject Fenster angeklickt werden bzw. ein System
aus der Auswahlliste ausgewaehlt wurde. Probieren Sie es aus.
http://www.lub.lu.se/cgi-bin/nmdc.pl

> 
> Ich habe aber bei meinen eigenen Sammlungen schon festgestellt, dass 
> es wahnsinnig schwierig ist erstens Schlagwoerter zu finden, die den 
> Inhalt moeglichst treffend beschreiben und zweitens bringt es auch 
> nichts, die Hauptschlagwoerter auf jeder Seite zu wiederholen.
> Ich bin fast schon wieder am Ueberlegen, ob ich die Schlagworte 
> wieder rausnehmen soll.

Intellektuell gewaehlte Schlagworte, ganz speziell wenn sie aus etablierten
Systemen entnommen sind, sind immer eine wesentliches Komplement zum
eventuell vorhandenen Volltext eines Dokuments, und stellen fuer die
Suche eine wichtige Verbesserung dar. Das gilt ganz besonders, wenn Dienste
sich diese Daten korrekt zu Nutze machen. 

Neben den dauernd zitierten globalen Suchsystemen gibt es verstaerkt
regionale Dienste (in der letzten Mitteilung schon erwaehnt) und fachbezogene Qualitaetsdienste (nur zwei deutsche 
Beispiele: IBIS und SSG-FI), die Ihre
Dokumente schneller und besser beschreiben, indexieren und zur Suche anbieten
koennen, wenn gute Metadaten vorliegen.
Alle Informationsvermittlungs- und -sucherfahrung zeigt, dass eine gute
inhaltliche Beschreibung die Suchergebnisse erheblich verbessern kann
und damit auch wieder fuer Sie als Nutzer der Dienste Zeit spart und Qualitaet
bringt.

> 
> Sehr sinnvoll halte ich aber den <meta name="description" content=""> 
> Tag und die definition der Sprache mittels
> <meta http-equiv="Content-Language" content="de">

Fuer Language gibt es auch ein Feld im Dublin Core Standard.
Auch Informationen zum Autor, Titel und (Dokument) Typ oder Kategorie
sind als wichtige minimale Metadaten anzusehen.
(vgl. das simple Formular unseres Creators).

Gruesse,
Traugott Koch
-- 
+-------------------------------------------------------------+
| TRAUGOTT KOCH,    Electronic information services librarian |
|  LUND UNIVERSITY LIBRARY, Development Department NetLab,    |
|  P.O. Box 3.  S-221 00  Lund, Sweden                        |
| Tel: int+46 46 2229233    Fax: int+46 46 2223682 or 2224422 |
| E-mail: traugott.koch _at__ ub2.lu.se                             |
| Personal homepage: http://www.ub2.lu.se/koch.html           |
+-------------------------------------------------------------+




Listeninformationen unter http://www.inetbib.de.