[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)



Herr Pohl hat ja interessante Ausführungen zum Thema „Weshalb Computer 
(nicht) verstehen“ 
(http://www.uebertext.org/2011/11/weshalb-computer-nicht-verstehen.html 
) gemacht.
Dazu ist zu sagen, dass unsere Sprache das Wort Verstehen leider sehr 
unscharf benutzt.
Denn es gibt vier Ebenen des Verstehens:
„1. Das Verstehen auf der Ebene der Informationstheorie. Ein Empfänger
(ein Lebewesen oder auch ein Computer) einer Nachricht hat zum Beispiel
etwas akustisch verstanden, reagiert aber beliebig. (Alter Spruch
von Hundebesitzern. Mein Hund hört gut, er reagiert aber nicht.) Oder
etwas ernster gesagt, ein ausreichend intelligenter Automat versteht 
Zeichen
auf der Informationsebene, er vermag sie richtig zu decodieren und
als neu, als redundant oder als Rauschen zu identifizieren.

2. Das Verstehen auf der Ebene der Semiotik. Ein Empfänger einer 
Nachricht
hat diese inhaltlich verstanden, denn er erkennt die pragmatische
Bedeutung der Zeichen auf der semiotischen Ebene. Er interpretiert sie
und bringt sie in einen Zusammenhang mit anderen verwandten Begriffen.
Auch das vermag schon jeder Hund, wenn man ruft, „komm her“,
und er belegt sein Verständnis, indem er entsprechend reagiert."
[Einfüfung: Roboterhunde erreichen diese semiotische Ebene auch.]

"3. Das Verstehen auf der Wissensebene. Der Empfänger versteht die an
ihn gerichtete Nachricht nicht nur auf der informatorischen und der
semiotischen Ebene, sondern erkennt auch noch die Begründung 
beziehungsweise
die Konsequenzen, die sich aus dieser Nachricht ergeben.
Auch diese Verstandesebene erfüllt beispielsweise ein Hund noch. So
kann man erkennen, dass er beim Ruf „komm her“, unter bestimmten
Randbedingungen sofort den Schluss zieht, dass er jetzt spazieren gehen
wird.

4. Das Verstehen auf der Bewusstseinsebene. Ein Empfänger erkennt nicht
nur den Wissensgehalt einer Nachricht, sondern reflektiert dieses 
Wissen
auch noch in der Weise, dass er ein Wissen über sein Wissen gewinnt.
Dies vermag ein Hund beispielsweise nicht zu leisten. Er kann 
erfahrungsgemäß
über sein Wissen definitiv nicht nachdenken. Bei Affen wird seit
Jahren versucht herauszufinden, wie weit sie diese Hürde zu überwinden
vermögen, wobei man allerdings bei den Interpretationen entsprechender
Versuche sehr vorsichtig sein muss." (Zwischen Informationsflut und 
Wissenswachstum S. 112)

Von der Phylogenese her kam die Fähigkeit des Menschen über sein 
unbewussstes und unterbewusstes Wissen nachzudenken sehr spät. Zum Teil 
wird diese Intelligenzstufe erst im Kindesalter (also noch nicht 
embryonal) entwickelt.

Schon in der Schule war es immer schwierig, wenn Lehrer fragten "Hast 
du mich verstanden?, und es einmal akustisch, einmal inhaltlich, einmal 
von der Begründung her und einmal von der Logik her meinten. Dazu muss 
man sagen, die Begründung war nicht immer logisch ;-) - sondern oft nur 
empirisch (das haben wir immer so gemacht).

Es stimmt sicher, dass das Modell von Shannon nur allzu oft 
missverstanden worden ist, wie Herr Pohl schreibt. Dazu gehört aber 
auch, dass das Modell auf natürliche Sprache angewendet werden kann. 
Shannon hat das ja selbst schon getan. Das Bit als Maß für die 
Informationsmenge gilt für jede Information, nicht nur für Computer, wo 
es dann später am häufigsten angewandt wurde.

Es ist auch teilweise richtig: „Shannon geht es eben um das 
"engineering problem", so dass Konzepte wie "Bedeutung", "Semantik", 
"Verstehen" schlicht irrelevant in diesem Modell sind.“ Darum erfordert 
ja auch die Ebene der Informationstheorie die nächst höheren Ebenen, wie 
man beim „Verstehen“ sieht.

MfG

Walther Umstätter


Am 03.09.2012 00:34, schrieb Adrian Pohl:
Liebe Liste,

dank an Jörg Prante für die Erläuterungen. Ich bin zwar kein EDVler
aber habe mich immerhin mit Linked Open Data und dem Semantic Web
etwas auseinandergesetzt und will versuchen, in Anknüpfung an Jörgs
Ausführungen diese zu ergänzen:

Im Gegensatz zur Auszeichnungssprache XML ist RDF ist ein Datenmodell
(nicht zu Verwechseln mit einem Datenmodell wie es etwa FRBR
darstellt, das auf einer höheren Ebene der Datenmodellierung
anzusiedeln ist). Als elementares, abstraktes Datenmodell gibt es an,
wie Daten/Aussagen mit Unicode-Zeichen ausgedrückt werden können.
Tripel und Graph sind die zwei Erscheinungsformen von RDF, wobei ein
Graph eine Menge von Tripeln ist.

RDF ist so konzipiert, dass es ohne Dokumente auskommen kann, weil 
das
Tripel die Basiseinheit ist. (Man könnte auch sagen, dass es in RDF
eben die Tripel sind, die elementare Dokumente darstellen.) Das ist 
m.
E. der wichtigste Unterschied von RDF zu den gewohnten
Record/Datensatz-basierten (wozu auch XML gehört) oder
tabellenbasierten (relationale Datenbanken) Formen der
Datenrepräsentation. In einem Triple Store etwa ist eine ungeordnete
Menge einzelner Tripel gespeichert. Tripel können verschiedenen
Graphen (Named Graphs) zugeordnet sein.

RDF-Graphen lassen sich allerdings auch in die Form eines 
hierarchisch
strukturierten Dokuments bringen. Dazu wird etwa die
RDF-Serialisierung RDF/XML oder neuerdings JSON-LD verwendet. Für
Maschinen spielen strukturelle Informationen wie Reihenfolge und
Hierarchien, die ein RDF-XML-Dokument mit sich bringt, allerdings
keine Rolle und werden ignoriert. (Will man etwa eine Liste in RDF
kodieren, so muss dies auch in Form von ungeordneten Tripeln
geschehen, weil es das Prinzip des Vorher-Nachher bei den Tripeln
eines Graphs nicht gibt.) Eine dokumentenbasierte, hierarchische 
Sicht
auf RDF verstellt den Blick auf die dahinterliegende Graphenstruktur,
und es bringt naturgemäß einige Probleme mit sich, RDF in der Syntax
hierarchischer Dokumenten zu repräsentieren (vgl. [4]). Seiner
Unzulänglichkeiten zum Trotz war anfangs RDF/XML die am häufigsten
benutzte RDF-Serialisierung (und ist es vielleicht heute noch), weil
XML der Standard für den Datenaustausch im Web war, zu dem eine
Vielzahl von Programmiertools etc. existierten.

Es ist wichtig klarzustellen, dass RDF allein noch kein Semantic Web
macht. Ebenso wie man MARC in XML darstellen kann ohne einen Mehrwert
zu gewinnen, lassen sich MARC-Datensätze auch nach RDF überführen.
Dafür existiert sogar bereits ein Vokabular[5], das letztlich eine
Übersetzung von Feld-Unterfeld-Indikatoren-Kombinationen in einfache
RDF-Properties ist und keine wirkliche Ontologie, mittels derer sich
weitere Aussagen inferieren lassen. Kommt dann noch dazu, dass sich 
in
Objektstellung der Tripel allein Literale und keine URIs also Links 
zu
anderen Entitäten finden, ist mit einer Repräsentation der
Katalogdaten in RDF wenig gewonnen im Vergleich zu einer
MARC-Codierung. Nach der Publikation des MARC21-RDF-Vokabulars wurde
auch entsprechende Kritik auf der DC-RDA-Mailingliste laut.[6]

Um "Semantik" zu bekommen ist es neben der Codierung von 
Informationen
in RDF wichtig, Ontologien zu formulieren und anzuwenden. Deshalb 
kann
ich Jörg nicht ganz zustimmen, wenn er schreibt, dass es ein Ziel des
Semantic Web sei, "diese Dokumentationen [welche die Bedeutung und 
die
Beziehung der verwendeten Tags definieren] überflüssig zu machen,
indem die Bedeutungen und die Beziehungen der Tags aus den Tags 
selbst
hervorgehen." Die Bedeutung oder vielleicht besser: Implikationen
einer bestimmten Beziehung zwischen zwei Dingen werden im Semantic 
Web
in sogenannten Ontologien festgelegt und gehen nicht unmittelbar aus
den Properties hervor. Zur Erstellung von Ontologien gibt es
Ontologiesprachen: das einfache RDF Schema (RDFS) oder für komplexere
Ontologien die Ontologiesprachen aus der OWL-Familie (Web Ontology
Language). Auf Basis von Ontologien und ihrer Anwendung kann aus
bestehenden Informationen weitere - implizit vorhandene - Information
generiert werden, was manchen dazu verleitet, Computern so etwas wie
"Verstehen" oder "Intelligenz" zu unterstellen und vom "Semantic Web"
zu reden. (Warum ich die Ausdrücke "Semantic Web", "Bedeutung",
"Denken" und "Verstehen" im Kontext der maschinellen Verarbeitung für
fehlgeleitet halte, habe ich in [7] näher erläutert.)

Viele Grüße
Adrian Pohl

[1] <http://de.wikipedia.org/wiki/Extensible_Markup_Language>

[2] <http://de.wikipedia.org/wiki/Auszeichnungssprache>

[3] <http://json-ld.org/>

[4]

<http://blog.ldodds.com/2010/12/02/rdf-and-json-a-clash-of-model-and-syntax/>

[5] <http://marc21rdf.info/>

[6] Siehe die Ankündigung von Gordon Dunsire

(<https://www.jiscmail.ac.uk/cgi-bin/webadmin?A2=ind1109&L=dc-rda&D=0&P=1704>)
und die darauf folgende Diskussion.

[7] 
<http://www.uebertext.org/2011/11/weshalb-computer-nicht-verstehen.html>


2012/9/2 Jörg Prante <joergprante@xxxxxxxxxxxxx>:

Sehr geehrte Frau Wiesenmüller,

Am 01.09.12 13:04, schrieb Heidrun Wiesenmüller:
Ich habe meine Mails in
dieser Sache wirklich nicht mal "eben schnell aus dem Ärmel
geschüttelt", sondern vieles nochmal recherchiert und nachgelesen, 
um zu
verifizieren, dass ich mit meinen Ansichten zu XML nicht auf dem 
Holzweg
bin - denn ich bin ja selbst keine EDVlerin. Deshalb fand ich's 
übrigens
auch etwas schade, dass sich niemand von den mitlesenden
Semantic-Web-Spezialisten zu Wort gemeldet hat - das wäre 
wahrscheinlich
sehr hilfreich gewesen und hätte die Diskussion bereichert.


Der Bitte an die "Semantic-Web-Spezialisten" möchte ich gern 
versuchen
nachzukommen - die Fragestellung war einfach, die Antwort ist es 
nicht.
Auch "EDVler" benötigen Zeit für eine qualifizerte Antwort. Wenn es
schnell gehen soll, haben wir ja unsere Maschinen :-)

Meinen Beitrag zur Diskussion habe ich unter der URL


http://jprante.github.com/lessons/2012/09/02/Warum-XML-nicht-reicht.html

bereit gestellt.

Außerhalb der Liste bin ich gefragt worden, was denn das für ein
Lehrbuch sei, an dem ich schreibe: Es ist ein Lehrbuch zu RDA.

Das ist ja eine tolle Überraschung. Ich freue mich über jede Quelle 
zur
Verwendung von RDA hierzulande. Gerne möchte ich ein Vorabexemplar
bestellen, ist das möglich?

Viele Grüße

Jörg Prante

--
http://www.inetbib.de

-- 
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.