[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Von ISBD zum Web 2.0 mit Mikroformaten



Liebe Kollegen,

Ich vermute mal, dass nicht wenige so wie ich zur Zeit in den Urlaub
entschwinden oder schon entschwunden sind. Um sich nicht im Sommerloch
langweilen zu müssen, habe ich hier eine kleine Aufgabe für
ISBD-Experten, Zukunftsinteressierte und andere Bibliothekare -
vielleicht hat ja jemand Zeit und Muße, sich in der freien Zeit mit
diesem wichtigen Thema zu beschäftigen.


Zusammenfassung

1. Im Web sind mehr und mehr Daten direkt und in standardisierten
Formaten zur Weiterverarbeitung verfügbar
2. Durchsetzen wird sich das, was direkt im Browser ohne Plugin
unterstützt wird
3. So wie es aussieht, werden dies Mikroformate sein
3. Für Bibliographsche Daten fehlt bislang ein Mikroformat
4. Wenn sich Bibliothekare nicht mit ihrem Sachverstand an der
Entwicklung eines solchen Formates beteiligen, tun es andere


Worum geht es?

Sicherlich sind Ihnen im Rahmen des "Web 2.0"-Hypes schon irgendwo die
Begriff "Web 3.0" oder "Semantic Web" untergekommen. Damit wird
(abgesehen von der Verwendung als Buzzword) auch auf die folgende
wichtige Entwicklung des Webs angespielt: Es werden immer mehr Daten
direkt und in standardisierten Formaten zur Weiterverarbeitung
verfügbar. Einfache Beispiele sind RSS und Dublin Core, auf der anderen
Skala der Komplexität stehen Ontologien und RDF. Auch das
Millionenprojekt Theseus hat zum Ziel, so genannte "semantische
Technologien" zu entwickeln.

Ich gehe jede Wette ein, dass in Zukunft mehr und mehr Daten mittels
"Semantischem Markup" in Webseiten integriert werden - bislang fehlte es
jedoch an einer  "Killerapplikation" und noch ist nicht festgelegt, in
welcher Form die Daten in Webseiten eingebunden werden. Eine bereits
jetzt nutzbare Form für bibliographische Daten ist das auf OpenURL
basierende COinS (ContextObjects in Spans) [1]. Allgemeinere Formen für
verschiedene Arten von Daten sind Microformats und RDFa [2].

Ob und wo sich Webstandards langfristig durchsetzen, hängt nicht zuletzt
davon ab, ob sie standardmäßig von Webbrowsern unterstützt werden -
bislang ist dies an über HTML hinausgehenden Formaten nur für RSS der
Fall. Nun ist es so, dass die vorraussichtlich Ende 2007 erscheinende
Version 3.0 des Firefox-Webbrowsers Microformats unterstützen wird [3].
Und Microsoft ist dabei, die Zwischenablage so zu erweitern, dass
einzelne Objekte von Webseiten kopiert werden können [4] - die ersten
Anwendungen sind die Mikroformate hCal und hCard. Damit ist klar, wohin
die Entwicklung geht.


Was sind Mikroformate?

Mit Mikroformaten können Webseiten so durch Markup angereichert werden,
dass ihre Inhalte möglichst detailliert auch für Computerprogramme
verarbeitbar sind. [5]. Hier als Beispiel meine Dienstanschrift [6]:

So kann es ein Mensch verstehen:

Verbundzentrale des GBV
Jakob Voß
Platz der Goettinger Sieben 1
37073 Göttingen
+49 (0)551 39-10242
jakob.voss@xxxxxx

Und so muss es in HTML als vcard-Microformat angegeben sein, damit es
auch Computer verstehen:

<div class="vcard">
 <div class="org">Verbundzentrale des GBV</div>
 <span class="fn">Jakob Voß</span>
 <div class="adr" class="work">
   <div class="street-address">Platz der Goettinger Sieben 1</div>
     <span class="postal-code">37073</span>
     <span class="locality">Göttingen</span>
 </div>
 <div class="tel">+49 (0)551 39-10242</div>
 <div class="email">
     <a href="mailto:jakob.voss@xxxxxx"; class="email" >jakob.voss@xxxxxx</a>
 </div>
</div>

Derzeit gibt es eine Reihe von etablierten Mikroformaten und weitere
sind in Entwicklung. Die Dokumentation und Diskussion findet offen in
einem Wiki unter http://microformats.org/wiki/ statt. Eine gute
Einführung in Mikroformate bietet das Buch "Microformats: Empowering
Your Markup for Web 2.0" und folgendes eBook auf deutsch:
http://www.oreilly.de/catalog/pdf_microformatsger/toc.html


Was hat das alles mit Bibliotheken zu tun?

Derzeit gibt es noch kein einheitliches Microformat für bibliographische
Angaben, allerdings schon einige Ansätze [7]. Wie Sie alle wissen, ist
es nicht trivial, ein bibliographisches Datenformat zu entwickeln, aber
das Web funktioniert pragmatisch - ich gehe davon aus, dass sich ein
citation-Microformat durchsetzen wird, sobald jemand einen Standard
dafür festlegt und umsetzt. Dabei kommt es nicht darauf an, wie gut
dieser Standard ist, sondern dass er gut dokumentiert, verfügbar und
benutzbar ist und dass er von einer kritischen Masse von Anbietern
verwendet wird (siehe dazu VHS vs. Betamax und Video 2000).

Nun können wir als bibliothekarisches Fachpersonal a) entweder abwarten,
bis sich der citation-Microformat-Standard stabilisiert hat und danach
darüber wundern, dass er aus bibliothekarischer Sicht an der einen oder
anderen Stelle völlig unzureichend ist oder b) uns aktiv an der
Entwicklung des citation-Microformat-Standards beteiligen und ihre
bibliothekarische Sachkompetenz einfließen lassen.


Und hier kommt ISBD ins Spiel!

Ich möchte zunächst betonen, dass die der Katalogisierung, Ansetzung und
dem Aufbau von Titelanzeigen nicht mein Fachgebiet sind. Soweit ich das
Konzept der International Standard Bibliographic Description (ISBD)
verstanden habe, legt dieser Standard fest, wie eine Titelaufnahme im
Katalog aussehen sollte - vereinfacht gesagt also die Reihenfolge und
Trennzeichen von Autor, Titel, Verlag und all die anderen Datenfelder
einer Titelaufnahme. Obgleich viele Kataloge sich nicht streng an ISBD
halten ist das Prinzip das gleiche: irgendwo ist festgelegt, welche
Titeldaten in welcher Weise formatiert angezeigt werden.

Bei Mikroformaten ist es ganz ähnlich. Nur wird bei einem Mikroformat
statt mit Sonderzeichen wie ; - [..] und , mit HTML-Tags <div>, <span>
und dem class-Attribut strukturiert.

Die Ferienbeschäftigung besteht also darin, eine Abbildung von ISBD
(bzw. der am häufigsten in OPAC-Titelanzeigen verwendeten Untermenge)
auf ein Mikroformat zu finden. Hier mal ein naiver Ansatz anhand eines
konkreten Beispiels der folgenden Titelaufnahme von
http://gso.gbv.de/DB=2.1/PPNSET?PPN=526230460&PRS=HOL (übrigens
Herzlichen Glückwunsch an die Braunschweiger, die als erste
GBV-Verbundbibliothek den neuen Harry Potter im Bestand haben :-)

Titel:  Harry Potter and the deathly hallows / Joanne K. Rowling. -
[Children's ed.], 1. ed. - London : Bloomsbury, 2007
ISBN:   0-7475-9105-9 - 978-0-7475-9105-4 (Children's edition)

Die bedeutungstragenden Bestandteile werden nun hierarchisch
ausgezeichnet, ohne den Text selber zu verändern (das geht auch gut mit
Papier und verschiedenfarbigen Stiften):

<div class='hCitation'>
  Titel:
  <span class='title'>Harry Potter and the deathly hallows</span> /
  <span class='n'>
    <span class='given-name'>Joanne K.</span>
    <span class='family-name'>Rowling</span>
  </span>. -
  [<span class='edition'>Children's ed.</span>], <span
class='edition-number'>1.</span> ed. -
  <span>
    <span class='location'>London</span> : <span
class='publisher-name'>Bloomsbury</span>
  </span>,
  <span class='publication-year'>2007</span>
</div>
<div>
  ISBN:
  <span class='ISBN'>0-7475-9105-9</span> -
  <span class='ISBN'>978-0-7475-9105-4</span>
  (<span class='edition'>Children's edition</span>)
</div>

Dabei muss festgelegt werden, wie fein die Daten aufgespalten werden
sollen und wie die einzelnen Elemente mit class="..." benannt werden.
Sicherlich können nicht alle in ISBD vorhandenen Spezialfelder und
Sonderregeln berücksichtigt werden, die Anzahl der Felder soll
schließlich überschaubar bleiben. Aüßerdem müssen wo möglich, bereits
bestehende Microformats und andere Formate berücksichtigt werden - so
sind die Feldbezeichnungen für Namen mit 'n', 'given-name' und
'familiy-name' bereits im hCard-Standard festgelegt, da gibt es nichts
zu ändern.[8]

Was also zu erstellen ist, ist eine genaue Festlegung eines Mikroformats
für bibliographische Angaben. Vielleicht kann auch von anderen Standards
als ISBD ausgegangen werden (OpenURL, RAK, AACR, MAB, MARC, MODS,
BibTeX...) - in jedem Fall muss aber die Titelanzeige ausgezeichnet
werden, so wie sie der Nutzer im Katalog sieht [9]. Um es nochmal zu
betonen: Wenn Firefox und Microsoft sich auf Mikroformate festlegen und
diese von Haus aus unterstützen, ist es völlig egal, wie gut
Mikroformate sind und ob es Alternativen gibt. Das das Format am Ende
allen erdenklichen bibliothekarischen Ansprüchen genügen wird, bezweifle
ich, aber es besteht zumindest die Möglichkeit, Einfluss zu nehmen - noch.

Viel Spaß und Schöne Grüße,
Jakob Voß


P.S.: Der traditionelle Weg wäre vermutlich, eine Arbeitsgruppe
"Mikroformate" mit den entsprechenden Experten einzurichten. Das kann
zwar grundsätzlich nicht schaden, jedoch sollte folgendes bedacht
werden: Erstens hätte diese AG sowieso keinerlei
Entscheidungsbefugnisse, da die Diskussion offen im Microformate-Wiki
stattfindet, wo sich jeder beteiligen kann und zweitens haben wir keine
Zeit für langwierige Projektplanungsphasen. Was zählt ist nur das direkt
online verfügbare Ergebnis und kein Projektbericht oder Sitzungsprotokoll.

P.P.S: Mein Kollege Kinstler hat die Notwendigkeit zum Handeln neulich
an dieser Stelle schon viel kürzer ausgedrückt:
http://www.ub.uni-dortmund.de/listen/inetbib/msg33525.html


[1] kurz http://de.wikipedia.org/wiki/COinS, siehe auch
http://jakoblog.de/2007/07/19/zotero-coins-und-technische-kompetenz-in-bibliotheken/#comment-1836
[2] Näheres zu den Unterschieden zwischen Microformats und RDFa siehe
http://evan.prodromou.name/RDFa_vs_microformats
[3] Siehe
http://bibliothek2.wordpress.com/2007/01/15/firefox-30-furs-web-30-light/
und die ausführliche Veranschauligung unter
http://blog.mozilla.com/faaborg/projects/
[4] http://rayozzie.spaces.live.com/blog/cns!FB3017FBB9B2E142!285.entry
(siehe auch http://www.liveclipboard.org/)
[5] Siehe http://mikroformate.de/ und den Einführungsvortrag
http://mikroformate.de/grundlagen/s5/
[6] Zum Ausprobieren mit anderen Adressen siehe http://bueltge.de/hcard/
[7] http://microformats.org/wiki/citation
[8] Siehe http://microformats.org/wiki/hcard#Property_List
[9] Siehe dazu siehe dieses schöne Posting, das den Konflikt von
Bibliothekaren mit solch pragmatischen Lösungen darstellt:
http://onebiglibrary.net/story/software-simplicity-librarian-corner-case

-- 
Jakob Voß <jakob.voss@xxxxxx>, skype: nichtich
Verbundzentrale des GBV (VZG) / Common Library Network
Platz der Goettinger Sieben 1, 37073 Göttingen, Germany
+49 (0)551 39-10242, http://www.gbv.de



Listeninformationen unter http://www.inetbib.de.