[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Entwertung der GND



Liebe GND-Redaktion, liebe Kolleginnen und Kollegen,

der GND-Redaktion danke ich für die Stellungnahme zu meiner Rundmail vom 8. September 2020. Leider ist diese jedoch nicht dazu angetan, meine Bedenken gegen die vorgenommene Löschaktion zu zerstreuen. Eine falsche Entscheidung wird nicht dadurch besser, indem man betont, dass sei so beschlossen und auch entsprechend kommuniziert worden. Wir stimmen in der Zielsetzung ja überein, der von Ihnen gewählte Weg ist jedoch grundfalsch. Er berücksichtigt nicht die Entstehung, die Struktur und die Gegebenheiten des bestehenden Datenbestandes. Er suggeriert, es gäbe nur den Weg der Löschung, um eindeutige, zuverlässige Datensätze zu erhalten. Mit dieser Entscheidung beschreitet die DNB zugleich einen Sonderweg und koppelt sich von den internationalen Normierungsbemühungen ab. Die Umsetzung erfolgt inkonsequent und widersprüchlich, da offenkundig keine ausreichende Klarheit besteht, wann ein Personennormdatensatz eindeutig ist und wann nicht. Und schließlich zerstört die Löschaktion das Potential von Normdaten zur Vernetzung unterschiedlicher Informationsressourcen. Gestatten Sie mir, dass ich auf diese Punkte etwas näher eingehen möchte.

Beginnen wir mit der Frage, was macht einen Normdatensatz eindeutig. Der Datensatz http://d-nb.info/gnd/116321288 repräsentiert Frau Sally Rabinowitz. Folgt man dem Datensatz wird der Eintrag eindeutig durch die Angabe „Wirkungsdaten: 1939“ sowie durch die Landesangabe „Niederlande“. Verknüpft wird der Datensatz jedoch mit der 1910 erschienen Dissertation der Autorin. Hierfür gibt es aus den obigen Daten allein jedoch keinerlei Veranlassung. Wikidata verknüpft den obigen Datensatz u. a. mit dem Deutschen Literaturarchiv in Marbach. Dort finden sich u. a. folgende Angaben: geb. 22.07.1889, Verlegerin, erste Veröffentlichung 1910. Der Katalog der DNB verzeichnet übrigens fünf Zeitschriftenbeiträge in den Monatsblättern des Jüdischen Kulturbundes Hamburg von Sally Rabinowitz aus den Jahren 1937/38. Eine Verknüpfung mit einem Personennormdatensatz erfolgt nicht, da dieser gelöscht wurde.

Anderes Beispiel: Mit dem Namen Sigrid Rapp sind/waren folgende Normdaten verknüpft:

http://d-nb.info/gnd/1202533345

Informationen: Mann, Sigrid (Früherer Name); Lebensdaten: 1934-; Geburtsort: Biberach an der Riß.

http://d-nb.info/gnd/1158930259

Informationen: Mann, Sigrid (Früherer Name).

http://d-nb.info/gnd/106122525 [gelöscht]

Informationen: andere Namen: Mann, Sigrid (Früherer Name).

Die letztere war mit der 1965 erschienenen Dissertation der Autorin verknüpft. Diese wurde gelöscht. Die mittlere GND wurde nicht gelöscht, obgleich sie mit keinem Werk verbunden war und auch nicht mehr Informationen enthielt. Schaut man sich das Ganze in VIAF an, so verknüpfen vier Bibliotheken die Dissertation mit der Autorin und die DNB bietet zwei vermeintlich individualisierte Datensätze ohne Werkverknüpfung. Zieht man den Worldcat oder den KVK heran, so findet sich neben der erwähnten Dissertation nur eine weitere Veröffentlichung von Sigrid Rapp aus dem Jahre 1996, nämlich zur Limnologie der Blau. Diese wird im K10plus locker dem obigen ersten Personennamendatei zugeordnet. Eine 62jährige, die 31 Jahre nach ihrer Dissertation über den Enzyklopädisten Jaucourt eine naturwissenschaftliche Diplomarbeit anfertigt, klingt wenig überzeugend.

Beispiele dieser Art könnte ich seitenweise zusammenstellen. Sie machen deutlich, die Beschränkung auf vermeintlich eindeutige Datensätze führt nicht zu validen Daten. Eindeutigkeiten oder besser Plausibilitäten, und auf die kommt es letztlich an, ergeben sich nicht aus isolierten Personendatensätzen, sondern aus der Verknüpfung mit weiteren Daten, insbesondere mit zur Person passenden Veröffentlichungen. Wenn Sie in Ihrer Entgegnung darauf hinweisen, es würde in meinem Fall eine konkret mir zugeordnete GDN und eine für alle Personen mit dem gleichen Namen geben, so ist dies schlicht irreführend. Warum wurde denn die Datei für alle Personen dieses Namens angelegt. In der Praxis doch wohl deshalb, weil Veröffentlichungen von mir in die Kataloge aufgenommen worden sind. Sieht man von meinem gegenwärtigen Projekt ab, so handelt es sich ausschließlich um Veröffentlichungen zur Geschichte des Mittelalters und zur Geschichtsdidaktik. Kein Katalog weist andere Werke auf. Auch wenn der Personendatensatz keine weiteren Informationen enthält ist, ist er in Verknüpfung mit meinen Schriften eindeutig. Zu spekulieren, es könnte ja noch weitere Autoren mit dem gleichen Namen geben, die jedoch kein Katalog verzeichnet, ist schlicht weltfremd. Da mein gegenwärtiges Projekt des Aufbaus einer virtuellen Bibliothek historischer Nachschlagewerke eben auch auf einen Historiker hindeutet, bleibt der Datensatz eindeutig und deckt sich im Kern mit der mir konkret zugeordneten GND. Auch in meinem Fall also wieder Informationskahlschlag. Es gibt eine Person, von der man nicht weiß, ob sie irgendetwas veröffentlicht hat. Zugleich existiert angeblich eine unbekannte Zahl von Personen, die alle im gleichen Bereich veröffentlichen, die man aber nichts kennt. Mit anderen Worten, in der Praxis wird die ursprünglich angelegte unspezifizierte GND erst dann uneindeutig, wenn eine Person mit dem gleichen Namen wie im Fall von Sigrid Rapp Werke veröffentlicht, die nicht in das ursprüngliche Profil passen.

Dies festzustellen, muss nicht „intellektuell“, was immer das auch heißen mag, erfolgen, dies erreicht man in diesem wie auch in anderen Fällen durch entsprechend programmierte Software. Der Kollege Frank Förster hat hierauf in seiner Mail vom 9. September 2020 zu Recht hingewiesen.

Der Verweis, dass die Recherche auch ohne GND über die Bibliothekskataloge „zum gleichen Ergebnis führt, unabhängig davon, ob der Personenname als Zeichenkette oder als GND-Referenz erfasst wurde,“ kommt einem Offenbarungseid für das GND-System gleich. Der Mehrwert der GND liegt ja gerade in der Tatsache, dass sie die Recherche und die Verknüpfung über die Bibliotheksgrenzen hinaus ermöglichen. Das einfache Beispiel Sally Rabinowitz hat den Mehrwert solcher Verknüpfungen m. E. deutlich unterstrichen. Das kann nur funktionieren, wenn einmal vergebene Links permanent erreichbar gehalten werden. In den obigen Fällen hätte dies nach einer Datenbereinigung bedeutet, dass letztlich nicht mehr genutzte Links automatisch auf den neuen Standardlink umgeleitet wird. Stellt man bei der Datenbereinigung fest, dass sich hinter einem Personennormdatensatz tatsächlich mehrere Personen verbergen, so ist eben wie bei Wikipedia schon lange erfolgreich genutzt eine sog. Disambiguation Page anzulegen, von der dann auf die neuen Datensätze verlinkt wird.

Selbstverständlich bin ich bereit, mir auffallende Unstimmigkeiten mitzuteilen. Mit einem vertretbaren Aufwand ist dies für mich aber nur zu leisten, wenn die Möglichkeit besteht, die Meldung unmittelbar in Zusammenhang mit meinen Recherchen vorzunehmen. Vielleicht ließe sich ja bei den Normdatensätzen ein Button anbringen, so dass Nutzer/innen unmittelbar solche Unstimmigkeiten melden könnten.

Nichts für ungut, Sie die Mitarbeiter/innen am Projekt machen einen tollen Job, von dem wir alle profitieren, ich hoffe mit den Beispielen aber deutlich gemacht zu haben, dass durch die Löschungsentscheidung die Datenqualität nicht besser, sondern deutlich schlechter geworden ist. Deshalb möchte ich Sie noch einmal eindringlich bitten, die Aktion rückgängig zu machen. Verlässliche Daten lassen sich so jedenfalls nicht generieren. Im 21. Jahrhundert sollte man erwarten, dass erst die informationstechnischen Möglichkeiten zum Datenabgleich genutzt werden, bevor man zum Kahlschlag ansetzt.

Mit freundlichen Grüßen

Peter Ketsch

Cliothek e.V.

Am 11.09.2020 um 10:34 schrieb GND-Info:
Lieber Herr Ketsch, liebe Kolleg*innen,


vielen Dank für Ihr Interesse und Feedback zur GND.
Die Namensdatensätze für Personen (Tn-Datensätze) sind nach einem langen Abstimmungsprozess in der GND-Kooperative seit Mitte Juni 2020 nicht mehr Bestandteil der Gemeinsamen Normdatei (GND). Dies wurde im Vorfeld (23. August 2019) über verschiedene Kanäle auch angekündigt [1]. Ein Namensdatensatz (Tn) wurde bis zu diesem Zeitpunkt für verschiedene Personen mit demselben Namen genutzt und repräsentierten damit nicht eine bestimmte Person. Diese Datensätze wurden bisher immer dann angelegt, wenn die individualisierenden Merkmale für das Anlegen eines Personennormdatensatzes (Tp) nicht ausreichend vorhanden bzw. bekannt waren.

Die Namensdatensätze entsprechen somit nicht den heutigen Anforderungen an Normdaten, die eindeutig und 
zuverlässig Entitäten identifizieren und beschreiben. Darüber hinaus ist der Mehrwert für die 
Recherche sehr begrenzt, weil die Recherche über den Namen in den Bibliothekskatalogen zum gleichen Ergebnis 
führt, unabhängig davon, ob der Personenname als Zeichenkette oder als GND-Referenz erfasst wurde.

Deshalb sind die Verknüpfungen von Namensdatensätzen in den Titeldaten der Zeitschriftendatenbank (ZDB) und 
der Deutschen Nationalbibliothek (DNB) auch rückwirkend gelöst worden. Die Namensdatensätze sind jedoch 
weiterhin mittels Permalink (https://d-nb.info/gnd/...) erreichbar und sind mit dem Hinweis „Status: Datensatz 
ist nicht mehr Bestandteil der Gemeinsamen Normdatei (GND)“ versehen.

Bezüglich des Beispiels zu Ihrem Namen: Bisher gab und gibt es einen Datensatz, der Ihre Person 
repräsentiert http://d-nb.info/gnd/1158992467. Der Namensdatensatz http://d-nb.info/gnd/110658175 
repräsentierte bisher alle Personen, die den Namen „Peter Ketsch“ tragen.

Für jeden einzelnen Titel müsste intellektuell entschieden werden, ob er Ihrem Personendatensatz zuzuordnen ist. Um 
zukünftig in Titeldaten häufiger zu eindeutigen Verknüpfungen zu GND-Entitäten zu kommen, wird zur Zeit daran 
gearbeitet, verbesserte (Vorschlags-)Verfahren - auch unter Berücksichtigung anderer Normdaten – zu entwickeln. Diese sollen 
es ermöglichen, in Fällen wie dem Ihren, die Titeldaten-Verknüpfung mit dem richtigen Normdatensatz auf eine einfache und 
effektive Art und Weise zu erstellen.

Wenn Sie Interesse haben oder die Möglichkeit sehen, dass die bisherigen Namensdatensätze, die Sie verwendet 
haben, mittels der Informationen aus Ihrer Datenbank in neue Personendatensätze überführt werden 
können, würden wir uns freuen, wenn Sie uns kontaktieren würden.

Weitere Informationen finden Sie hier [2].

Mit freundlichen Grüßen,
i.A. Ihre GND-Redaktion

[1] https://www.dnb.de/SharedDocs/Downloads/DE/Professionell/Metadatendienste/Rundschreiben/rundschreiben20190823AbschaffungNamensdatensaetzen.pdf
[2] https://wiki.dnb.de/x/aJDOC


-----Ursprüngliche Nachricht-----
Von: InetBib [mailto:inetbib-bounces@xxxxxxxxxx] Im Auftrag von verein--- via 
InetBib
Gesendet: Dienstag, 8. September 2020 11:22
An: inetbib@xxxxxxxxxx
Betreff: [InetBib] Entwertung der GND


Sehr geehrte Damen und Herren, liebe Kolleginnen und Kollegen,

die Entwicklung der GND war und ist ein Quantensprung in dem Aufbau vernetzter, verlässlicher Rechercheinfrastrukturen. Im vergangenen Juni hat die 
DNB nun aber die Verknüpfung mehrerer tausend Personennormdatensätze von den bisherigen Titeldatensätzen gelöst. Die bisherigen 
GND-Links führen damit ins Nichts. Die Titel bleiben zwar weiterhin recherchierbar, die Verknüpfung mit weiteren Werken der jeweiligen 
Autor/innen oder weiterführenden Informationen - also dem eigentlichen informationstechnischen wie wissenschaftlichen Nutzen der GND - läuft 
jedoch ins Leere. Normdaten machen jedoch nur dann einen Sinn, wenn sie permanent verfügbar bleiben. Änderungen im System müssen zu 
Weiterleitungen führen, dürfen aber nicht in einer Sackgasse münden.

Verdeutlichen möchte ich die Problematik an einigen Beispielen:

   *

     Grimsley, Ronald (1963): Jean d'Alembert (1717 - 83). Oxford:
     Clarendon Press.

     Der Autor war bisher mit folgenden Link verknüpft:

     http://d-nb.info/gnd/151133948

     Dieser wurde nun gelöst, da vermeintlich keine ergänzenden
     individualisierenden Merkmale vorliegen. Der Virtual International
     Authority File http://viaf.org/viaf/24500 wie auch Wikidata
     https://www.wikidata.org/wiki/Q59527811 verfügen jedoch über die
     entsprechenden Daten. Konsequent wäre also die Ergänzung des
     Datensatzes, nicht aber dessen Löschung gewesen.

   *

     Heinlein, Otto (1939): August Bohse-Talander als Romanschriftsteller
     der galanten Zeit. Bochum: Pöppinghaus.

     Eine GND für den Autor ist nicht mehr auffindbar. DerVirtual
     International Authority File http://viaf.org/viaf/306074632
     verzeichnet ihn korrekt mit dem Geburtsdatum 1902. Ein Datum, das
     auch der DNB nicht unbekannt ist, schließlich hat sie die
     Dissertation als Digitalisat ins Netz gestellt
     https://nbn-resolving.org/urn:nbn:de:101:1-2012042510566 In der
     Dissertation ist wie üblich auch das Geburtsdatum angegeben.

   *

     Mein eigener Fall: Bisher gab es für mich zwei Datensätze

     http://d-nb.info/gnd/1158992467

     http://d-nb.info/gnd/110658175

     Publikationen von mir waren nur mit dem letzten Link verbunden. Die
     Verknüpfung mit dem Namen wurde nun gelöst, während der weiterhin
     vorhandene Link nur noch mit einigen biographischen Daten verbunden
     ist, nicht aber mit Titeln. Nun, ich hätte mich schon mal lange drum
     kümmern sollen. Sorry. Wenn man nun aber die früher mit dem zweiten
     Link verknüpften Werke mit dem ersten Link verbindet, so darf der
     zweite Link gleichwohl nicht wie vorgesehen gelöscht werden, da
     sonst externe Verknüpfungen ins Leere laufen. Korrekturen und
     Systemänderungen sollten konsequenterweise durch Weiterleitungen zum
     aktuellen, richtigen Link aufgefangen werden.

Das mit dem Vorgehen der DNB verbundene Anliegen, eindeutige und zuverlässige Entitäten zu identifizieren und zu beschreiben, ist grundsätzlich zu begrüßen, die 
Vorgehensweise, pauschal vermeintliche oder tatsächliche Unstimmigkeiten durch Entkoppelung und Löschung zu beseitigen, ist jedoch m. E. der falsche Weg und gefährdet die 
Akzeptanz der GND. Wäre es nicht vernünftiger, zunächst einen Datenabgleich mit anderen Normierungen vorzunehmen? So fällt immer wieder auf, dass GNDs gar nicht oder mit 
einem eigenen VIAF-Identifikator in der VIAF-Datenbank verzeichnet sind. Der Nutzwert der GND hängt doch auch von der systematischen und eindeutigen Verknüpfung mit anderen 
Identifikatoren ab. Weiterhin könnte man die wissenschaftliche Community zur Mitarbeit aufrufen, indem man um Mithilfe bei der Bereinigung von unklaren Datensätzen bittet. Eine weitere 
Möglichkeit wäre die Auflegung eines Sonderprogramms mit der Beschäftigung von studentischen Hilfskräften, die gerade in diesen Coronazeiten händeringend nach 
Beschäftigungsmöglichkeiten suchen.

Meine Mitarbeiter/innen und ich haben in den vergangenen Monaten bei der Vorbereitung des erweiterten 
Neuauftritts der bibliographischen Datenbank https://enzyklothek.de viel Zeit für die Verknüpfung 
der Datensätze mit den GND-Identifikatoren aufgebracht und können nun unsere Arbeit z. T. in die 
Tonne klopfen bzw. bieten den Nutzer/innen Links an, die nicht funktionieren. Anderen dürfte es 
ähnlich gehen.


Kurzum, mein Plädoyer: Erst Ergänzung und Korrektur sowie ggf.
Weiterleitung innerhalb des Systems, aber kein Kahlschlag bei den Daten.

Peter Ketsch

Cliothek e. V.




Listeninformationen unter http://www.inetbib.de.