[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Bedeutung von XML (war bibliojobs ... VAB)



Lieber Herr Umstätter,


Am 30.08.2012 11:04, schrieb h0228kdm:
So kam mir beim Verriss H. Wiesenmüllers der „Einführung in die
Katalogkunde“ der schöne Satz: „Die Bedeutung von XML schließlich, das
an vielen Stellen innerhalb des Bandes auftaucht, wird von den Autoren
stark überschätzt.“ (http://www.b-u-b.de/pdfarchiv/Heft-BuB_01_2006.pdf
) in Erinnerung, und das mitten in der Entwicklung des Semantic Web und
der Tatsache, dass FRBR, DDC etc. auf dieser XML Entwicklung aufbauen.

In der Tat teile ich Ihre Einschätzung zu XML nicht. Ich hatte in der 
damaligen Rezension geschrieben: "Die Bedeutung von XML schließlich, das 
an vielen Stellen innerhalb des Bandes auftaucht, wird von den Autoren 
stark überschätzt. Dieser Standard nämlich kann vorhandene 
bibliothekarische Formate nicht ersetzen, sondern ist nur eine neue - 
freilich sehr nützliche - Methode, um diese zu 'verpacken' (vor allem 
für den Datenaustausch, etwa über OAI). Auf die zugrunde liegenden 
Katalogisierungsregeln hat XML keinen unmittelbaren Einfluss."

Ich bezog mich dabei auf Passagen in Ihrem Buch wie diese:
"Sollte man nun den Schritt zu einer international verwendeten 
Verbundkatalogisierung tun, um dann gemeinsam mit all den anderen 
teilnehmenden Bibliotheken die bereits vorhandenen bibliothekarischen 
DTDs im Rahmen von XML nutzen, oder wäre es günstiger, in Deutschland 
ein eigenes moderneres Katalogisierungsformat anzustreben, das heute 
allerdings sicher auch auf der Basis von XML erzeugt werden muss." (S. 45)
"Mit Hilfe von Adaptionen werden die Übergänge von MARC zu XML und von 
AACR zu den Metadaten zur Zeit vorgenommen." (S. 46)
"Dabei wurde auch bereits von dem Ersatz von MARC durch ein 
entsprechendes XML-Format gesprochen. Hier handelt es sich um Software 
zur Konversion von MARC-Daten zu XML." (S. 56)

An MARC XML kann man gut sehen, was ich mit "Verpackung" gemeint habe. 
Hier ein Beispiel aus der offiziellen Dokumentation 
(http://www.loc.gov/standards/marcxml/Sandburg/sandburg.xml). Man 
vergleiche die MARC-Kategorie 100 (Haupteintragung unter einer Person):

normales MARC 21:
100 1_ $a Sandburg, Carl, $d 1878-1967.

(Erläuterung für Nicht-MARC-Kundige: der erste Indikator steht auf "1", 
d.h. es handelt sich um einen normalen Namen der Form "Nachname, 
Vorname". Der eigentliche Name kommt ins Unterfeld $a, die Lebensdaten 
in Unterfeld $b).

Und nun dasselbe in MARC XML:
<datafield tag="100" ind1="1" ind2="">
     <subfield code="a">Sandburg, Carl,</subfield>
     <subfield code="b">1878-1967.</subfield>
</datafield>

Alles, was hieran _semantisch_ ist (Definition der Datenelemente, 
Bedeutung der Indikatoren), stammt nicht aus XML, sondern aus MARC. 
Diese Informationen sind nun aber - jetzt kommt XML ins Spiel - in 
syntaktisch anderer Weise aufbereitet. XML bewegt sich also nach meinem 
Verständnis auf einer ganz anderen Ebene als bibliothekarische 
Datenformate wie MARC 21, als Metadatenstandards wie Dublin Core oder 
als RDA (das den Anspruch hat, ein gänzlich formatfreier "content 
standard" zu sein). Es ist keine Frage, dass man alles mögliche mit XML 
verpacken kann (sofern es irgendwie strukturiert ist) - aber das heißt 
doch nicht, dass XML dann dieses andere ersetzt.

Für den Austausch von Daten hat XML gewiss erhebliche Bedeutung - es ist 
ja nicht zufällig auch in der Industrie ein weit verbreiteter Standard. 
Es gibt m.W. auch XML-Datenbanken, die Daten nicht nur als XML ausgeben 
und einlesen können, sondern sie auch intern als XML-Dokumente vorhalten 
(z.B. BaseX). Solche Datenbanken haben manche Vorteile, sind aber wohl 
bei größeren Datenmengen nicht so performant wie relationale 
Datenbanken. Deshalb sehe ich im Moment nicht, dass sich XML als 
internes Datenbankformat auf breiter Front durchsetzen würde.

Sie bringen XML aber nun auch sehr stark mit dem Semantic Web in 
Verbindung, was ich nicht ganz nachvollziehen kann. Hier lesen gewiss 
Leute mit, die deutlich mehr vom Semantic Web verstehen als ich und mich 
bei Bedarf korrigieren können: Nach meinem Kenntnisstand ist XML _nicht_ 
die entscheidende Technologie im Semantic Web - und zwar deshalb, weil 
XML eben nur die Syntax betrifft und nicht die Semantik. Es hat deshalb 
für das Semantic Web nicht dieselbe Bedeutung wie etwa RDF oder OWL. Ich 
zitiere die englische Wikipedia: "XML provides an elemental syntax for 
content structure within documents, yet associates no semantics with the 
meaning of the content contained within. XML is not at present a 
necessary component of Semantic Web technologies in most cases, as 
alternative syntaxes exists, such as Turtle." 
(http://en.wikipedia.org/wiki/Semantic_Web)

Gänzlich neu wäre mir, dass - was Sie als "Tatsache" bezeichnen - "FRBR, 
DDC etc. auf dieser XML Entwicklung aufbauen". FRBR ist ein 
Entity-relationship model. Die ERM-Methodik (Definition von Entitäten 
mit bestimmten Merkmalen, sowie den Beziehungen zwischen den Entitäten) 
stammt aus dem Design relationaler Datenbanken und wurde, soweit ich 
weiß, in den 1970-er Jahren entwickelt. "XML" kommt im ganzen 
FRBR-Bericht nirgends vor.

Außerdem wurde vor einigen Jahren eine objektorientierte Variante von 
FRBR als formale Ontologie entwickelt (FBRRoo): 
http://www.cidoc-crm.org/frbr_drafts.html
Auch dieses bewegt sich auf einer ganz anderen Ebene als der rein 
syntaktischen, und XML wird nicht erwähnt.

Ich rätsele auch, wo Sie den Bezug zwischen der DDC und XML sehen. 
Natürlich kann man die DDC - wie andere Klassifikationen oder Thesauri 
auch - mit der Datenbeschreibungssprache SKOS ausdrücken und damit für 
das Semantic Web aufbereiten. SKOS wiederum baut auf RDF auf. Und für 
RDF-Tripel braucht man wieder irgendeine Syntax wie RDF-XML oder Turtle. 
Aber daraus folgt doch nicht, dass die DDC auf XML aufbaut...

Tja, und damit bin ich nun mit meinen Exegese-Künsten am Ende.

Viele Grüße
Heidrun Wiesenmüller

-- 
---------------------
Prof. Heidrun Wiesenmüller M.A.
Hochschule der Medien
Fakultät Information und Kommunikation
Wolframstr. 32, 70191 Stuttgart
Tel. dienstl.: 0711/25706-188
Tel. Home Office: 0711/36565868
Fax. 0711/25706-300
www.hdm-stuttgart.de/bi

-- 
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.