[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)



Liebe Liste,

dank an Jörg Prante für die Erläuterungen. Ich bin zwar kein EDVler
aber habe mich immerhin mit Linked Open Data und dem Semantic Web
etwas auseinandergesetzt und will versuchen, in Anknüpfung an Jörgs
Ausführungen diese zu ergänzen:

Im Gegensatz zur Auszeichnungssprache XML ist RDF ist ein Datenmodell
(nicht zu Verwechseln mit einem Datenmodell wie es etwa FRBR
darstellt, das auf einer höheren Ebene der Datenmodellierung
anzusiedeln ist). Als elementares, abstraktes Datenmodell gibt es an,
wie Daten/Aussagen mit Unicode-Zeichen ausgedrückt werden können.
Tripel und Graph sind die zwei Erscheinungsformen von RDF, wobei ein
Graph eine Menge von Tripeln ist.

RDF ist so konzipiert, dass es ohne Dokumente auskommen kann, weil das
Tripel die Basiseinheit ist. (Man könnte auch sagen, dass es in RDF
eben die Tripel sind, die elementare Dokumente darstellen.) Das ist m.
E. der wichtigste Unterschied von RDF zu den gewohnten
Record/Datensatz-basierten (wozu auch XML gehört) oder
tabellenbasierten (relationale Datenbanken) Formen der
Datenrepräsentation. In einem Triple Store etwa ist eine ungeordnete
Menge einzelner Tripel gespeichert. Tripel können verschiedenen
Graphen (Named Graphs) zugeordnet sein.

RDF-Graphen lassen sich allerdings auch in die Form eines hierarchisch
strukturierten Dokuments bringen. Dazu wird etwa die
RDF-Serialisierung RDF/XML oder neuerdings JSON-LD verwendet. Für
Maschinen spielen strukturelle Informationen wie Reihenfolge und
Hierarchien, die ein RDF-XML-Dokument mit sich bringt, allerdings
keine Rolle und werden ignoriert. (Will man etwa eine Liste in RDF
kodieren, so muss dies auch in Form von ungeordneten Tripeln
geschehen, weil es das Prinzip des Vorher-Nachher bei den Tripeln
eines Graphs nicht gibt.) Eine dokumentenbasierte, hierarchische Sicht
auf RDF verstellt den Blick auf die dahinterliegende Graphenstruktur,
und es bringt naturgemäß einige Probleme mit sich, RDF in der Syntax
hierarchischer Dokumenten zu repräsentieren (vgl. [4]). Seiner
Unzulänglichkeiten zum Trotz war anfangs RDF/XML die am häufigsten
benutzte RDF-Serialisierung (und ist es vielleicht heute noch), weil
XML der Standard für den Datenaustausch im Web war, zu dem eine
Vielzahl von Programmiertools etc. existierten.

Es ist wichtig klarzustellen, dass RDF allein noch kein Semantic Web
macht. Ebenso wie man MARC in XML darstellen kann ohne einen Mehrwert
zu gewinnen, lassen sich MARC-Datensätze auch nach RDF überführen.
Dafür existiert sogar bereits ein Vokabular[5], das letztlich eine
Übersetzung von Feld-Unterfeld-Indikatoren-Kombinationen in einfache
RDF-Properties ist und keine wirkliche Ontologie, mittels derer sich
weitere Aussagen inferieren lassen. Kommt dann noch dazu, dass sich in
Objektstellung der Tripel allein Literale und keine URIs also Links zu
anderen Entitäten finden, ist mit einer Repräsentation der
Katalogdaten in RDF wenig gewonnen im Vergleich zu einer
MARC-Codierung. Nach der Publikation des MARC21-RDF-Vokabulars wurde
auch entsprechende Kritik auf der DC-RDA-Mailingliste laut.[6]

Um "Semantik" zu bekommen ist es neben der Codierung von Informationen
in RDF wichtig, Ontologien zu formulieren und anzuwenden. Deshalb kann
ich Jörg nicht ganz zustimmen, wenn er schreibt, dass es ein Ziel des
Semantic Web sei, "diese Dokumentationen [welche die Bedeutung und die
Beziehung der verwendeten Tags definieren] überflüssig zu machen,
indem die Bedeutungen und die Beziehungen der Tags aus den Tags selbst
hervorgehen." Die Bedeutung oder vielleicht besser: Implikationen
einer bestimmten Beziehung zwischen zwei Dingen werden im Semantic Web
in sogenannten Ontologien festgelegt und gehen nicht unmittelbar aus
den Properties hervor. Zur Erstellung von Ontologien gibt es
Ontologiesprachen: das einfache RDF Schema (RDFS) oder für komplexere
Ontologien die Ontologiesprachen aus der OWL-Familie (Web Ontology
Language). Auf Basis von Ontologien und ihrer Anwendung kann aus
bestehenden Informationen weitere - implizit vorhandene - Information
generiert werden, was manchen dazu verleitet, Computern so etwas wie
"Verstehen" oder "Intelligenz" zu unterstellen und vom "Semantic Web"
zu reden. (Warum ich die Ausdrücke "Semantic Web", "Bedeutung",
"Denken" und "Verstehen" im Kontext der maschinellen Verarbeitung für
fehlgeleitet halte, habe ich in [7] näher erläutert.)

Viele Grüße
Adrian Pohl

[1] <http://de.wikipedia.org/wiki/Extensible_Markup_Language>

[2] <http://de.wikipedia.org/wiki/Auszeichnungssprache>

[3] <http://json-ld.org/>

[4] 
<http://blog.ldodds.com/2010/12/02/rdf-and-json-a-clash-of-model-and-syntax/>

[5] <http://marc21rdf.info/>

[6] Siehe die Ankündigung von Gordon Dunsire
(<https://www.jiscmail.ac.uk/cgi-bin/webadmin?A2=ind1109&L=dc-rda&D=0&P=1704>)
und die darauf folgende Diskussion.

[7] <http://www.uebertext.org/2011/11/weshalb-computer-nicht-verstehen.html>


2012/9/2 Jörg Prante <joergprante@xxxxxxxxxxxxx>:
Sehr geehrte Frau Wiesenmüller,

Am 01.09.12 13:04, schrieb Heidrun Wiesenmüller:
Ich habe meine Mails in
dieser Sache wirklich nicht mal "eben schnell aus dem Ärmel
geschüttelt", sondern vieles nochmal recherchiert und nachgelesen, um zu
verifizieren, dass ich mit meinen Ansichten zu XML nicht auf dem Holzweg
bin - denn ich bin ja selbst keine EDVlerin. Deshalb fand ich's übrigens
auch etwas schade, dass sich niemand von den mitlesenden
Semantic-Web-Spezialisten zu Wort gemeldet hat - das wäre wahrscheinlich
sehr hilfreich gewesen und hätte die Diskussion bereichert.


Der Bitte an die "Semantic-Web-Spezialisten" möchte ich gern versuchen
nachzukommen - die Fragestellung war einfach, die Antwort ist es nicht.
Auch "EDVler" benötigen Zeit für eine qualifizerte Antwort. Wenn es
schnell gehen soll, haben wir ja unsere Maschinen :-)

Meinen Beitrag zur Diskussion habe ich unter der URL

http://jprante.github.com/lessons/2012/09/02/Warum-XML-nicht-reicht.html

bereit gestellt.

Außerhalb der Liste bin ich gefragt worden, was denn das für ein
Lehrbuch sei, an dem ich schreibe: Es ist ein Lehrbuch zu RDA.

Das ist ja eine tolle Überraschung. Ich freue mich über jede Quelle zur
Verwendung von RDA hierzulande. Gerne möchte ich ein Vorabexemplar
bestellen, ist das möglich?

Viele Grüße

Jörg Prante

--
http://www.inetbib.de

-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.