[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Bibliographic Framework Transition Initiative



Wiewohl ein Austauschformat obsolet scheint, geht es auch bei RDF nicht 
ganz ohne Vereinbarungen. Was darf es z.B. für das Prädikat "Autor" sein:

dc:creator
mods:name
marc:100
pica:3000
mab:100
tei:author
etc.


Bedauerlicherweise sind diese Prädikate der jeweiligen Ontolgie dann auch nicht 
hunderprozentig kompatibel.  Was ich auch noch nicht ganz verstehe, ist, wie 
die Identifizierung der Objekte über URIs sichergestellt werden kann, denn eine 
owl:sameAs Relation über alle möglichen Identifier wird sicher wenig praktikal 
sein bzw. habe ich in den Beispielen, die ich kenne, noch nicht gesehen.

Viele Grüße,
Thomas Stäcker




Am 14.03.2012 13:21, schrieb Jakob Voss:
Hallo,

Ich möchte hier nur den einen Aspekt des "Austauschformat" aufgreifen,
da er in der Diskussion immer wieder auftaucht:

Heinrich Allers fragte:

  >  Und welches ist das Austauschformat, das den neuen Möglichkeiten des
  >  Regelwerks entspricht? [...] Ein Regelwerk scheint es zu geben, aber
  >  von einem neuen Austauschformat, in das dann die neuen Inhalte zu
  >  gießen wären, fehlt jede Spur.

Das Austauschformat ist RDF bzw. ist das Konzept Austauschformat mit RDF
obsolet, da nicht mehr Datensätze sondern einzelne Daten (im RDF-Sprech
"Aussagen" oder "Tripel") erstellt, zur Verfügung gestellt, abgerufen
und kombiniert werden. Die wichtigsten Eigenschaften sind:

1. Verwendung von URIs zur Identifizierung von Objekten. So verweist
z.B. die URI<http://d-nb.info/1001703464>  auf eine konkrete Auflage
eines Buches und die URI<http://d-nb.info/gnd/118540475>  auf eine
konkrete Person. Damit werden Ansetzungsformen, lokale Identifier und
andere kryptische Zeichenketten, die nur nach jahrelangem Studium von
Regelwerken und Bibliotheksspezifischen Uminterpretierungen derselben
automatisch nutzbar sind, an Bedeutung.

2. Kombinierbarkeit von Tripeln. In RDF gibt es keine Datensätze mit
Feldern und Unterfeldern sondern nur einfache Aussagen der Form
Subjekt-Prädikat-Objekt. Tripel aus verschiedenen Quellen lassen sich
kombinieren, sofern Überschneidungen bei den von ihnen verwendeten URIs
und/oder der von ihnen verwendeten Ontologien vorliegen. Das Mischen von
verschiedenen Datenquellen benötigte bisher Austauschformate und
Konvertierungen. Hier ein Beispiel:

In einer Quelle steht, dass ein bestimmtes Buch von einer bestimmten
Person stammt [1]:

<http://d-nb.info/1001703464>  a bibo:Book;
    dc:creator<http://d-nb.info/gnd/118540475>  .
<http://d-nb.info/gnd/118540475>  a foaf:Person .

In einer anderen Quelle stehen weitere Informationen über die Person,
z.B. Name und ein Foto:

<http://d-nb.info/gnd/118540475>
owl:sameAs<http://dbpedia.org/resource/Emma_Goldman>  .
<http://dbpedia.org/resource/Emma_Goldman>
    foaf:givenName "Emma"; foaf:surname "Goldman"
    foaf:depiction
<http://upload.wikimedia.org/wikipedia/commons/3/37/Emma_Goldman_seated.jpg>
.

In einer dritten Quelle steht dass das Buch mit zwei Exemplaren im
Bestand einer bestimmten Bibliothek ist:

<http://d-nb.info/1001703464>
    daia:collectedBy<http://uri.gbv.de/organization/isil/DE-18>  .
    daia:exemplar
      <http://uri.gbv.de/document/opac-de-18:epn:1184464332>,
      <http://uri.gbv.de/document/opac-de-18:epn:1220640794>  .

All diese Quellen lassen sich ohne Austauschformat direkt
zusammenführen, so dass beispielsweise das Foto der Autorin zusammen mit
anderen Informationen über die Exemplare angezeigt werden kann. Nach dem
herkömmlichen Paradigma müsste dafür erst eine Regelwerkserweiterung
beschlossen werden, in dem eine Kategorie für "Abbildungen von Autoren
zu Exemplarsätzen" o.Ä. geschaffen wird.

Um sich mit RDF im Bibliothekskontext vertraut zu machen, gibt es
inzwischen zahlreiche Quellen, z.B. die Vorträge der SWIB-Konferenz. Ich
habe 2010 in einem Vortrag versucht, ohne viele technischen Details zu
erklären was eigentlichen Daten sind und wie sie mit RDF und Linked Data
verarbeitet werden. Das Video ist online:

http://biblog.fh-zwickau.de/2010/07/08/video-zum-vortrag-uber-semantic-web/

Schöne Grüße
Jakob Voß


[1] Die Beispiele sind in der so genannten Turtle-Syntax für RDF
geschrieben. Turtle-Syntax ist nicht schwer - Rudimentäre Lesekompetenz
in RDF/Turtle sollten sich alle aneignen, die sich mit
Katalogisierung oder anderen Formen der Datenerfassung und -verarbeitung
beschäftigen und dies auch noch in den kommenden Jahren in für andere
nutzbarer Form tun wollen.



-- 
---------------------------------------------
Dr. Thomas Stäcker
Stellv. Direktor
Herzog August Bibliothek Wolfenbüttel
Tel. +49+5331/808-303
Email staecker@xxxxxx


-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.