[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Frage: Kopie der DOI Datenbank (DOI und Weiterleitungen)?



Vielen Dank für Ihre ausführlichen Antworten.

Im Zuge weiterer Recherchen bin ich auf

http://xml.coverpages.org/ECPA-PersistentIdentifiers.pdf

gestoßen, welches einige Dinge erhellt.

Es gibt nicht die "definitive Datenbank" als an einem Ort vorhandene Instanz. 
Zu vergleichen ist das eher mit dem Domain Name System (DNS) - ...

Insgesamt leuchtet mir der Vergleich zwischen DOI und DNS ein, was
gegen einen Gesamtabzug spricht. Allerdings gibt es auch sich ständig
wandelnde Datensätze (Wikipedia, Wikidata), die ganz offiziell
monatliche Gsamtabzüge anbieten [1].

Für eine Suchmaschinen-Suche nach: list of doi prefixes

führt aktuell der erste Treffen zu:

https://www.crossref.org/06members/50go-live.html

wo sichtbar wird, daß jemand (crossref) diese Daten über die Zeit
hinweg beobachtet. Auf Platz 3 gibt es eine Liste (von 2013):
https://gist.github.com/hubgit/5974843.

Ich nehme an, das Interesse an diesen doch recht speziellen
Fragestellungen (Liste von Prefixen, Liste von Weiterleitungen) hält
sich in Grenzen.


Vielen Danke und Grüße
Martin Czygan



[1] https://dumps.wikimedia.org/


On Wed, May 8, 2019 at 6:45 PM Hans-Werner Hilse via InetBib
<inetbib@xxxxxxxxxx> wrote:

Moin,

Am 2019-05-07 21:21, schrieb markus schnalke via InetBib:
Hoi.

[2019-05-07 17:12] Hans-Werner Hilse via InetBib <inetbib@xxxxxxxxxx>
Am 2019-05-06 16:56, schrieb Martin Czygan via InetBib:

Frage: Ist Ihnen bekannt, ob man die DOI-Datenbank als ganzes
herunterladen kann?

Das kann ich mir kaum vorstellen, da so etwas nicht direkt existieren
dürfte.
Das Handle-System ist verteilt und es gibt unterschiedliche Systeme,
die
die Antworten liefern. Eine Art Directory-Listing ist m.W. nie
spezifiziert worden.

Sind die Systeme redundant? D.h. kann man Mirrors betreiben,
die sich synchronisieren -- denn genau das ist ja letztlich
gesucht --, oder wird die eine definitive Datenbank zentral
verwaltet und nach einem zentral definierten und kontrollierten
Verfahren auf mehrer Rechner verteilt?

Es gibt nicht die "definitive Datenbank" als an einem Ort vorhandene
Instanz. Zu vergleichen ist das eher mit dem Domain Name System (DNS) -
ohne auch nur im Ansatz so weit fortgeschritten zu sein, was die
Architektur angeht (urteile ich mal recht brachial). Mit Ausnahme der
kryptographischen Absicherung der Zuständigkeiten vielleicht, das ist
ganz elegant beim Handle-System und Teil der Architekturspezifikation.

Ob einzelne Handle-Server redundant ausgelegt sind oder nicht ist - wie
beim DNS - Sache der diese betreibenden Institutionen. Sehr
wahrscheinlich wird das wohl der Fall sein. "Man" kann aber nicht so
einfach einen Mirror betreiben (weil: nicht aufbauen, weil: nicht
enumerieren, was ein anderer Server vorhält) - genauso wie auch beim
DNS.

Nun ist DOI aber mehr als das Handle-System und hat sicher mehr
Verfahren und beschränkt sich in der Nutzung der Möglichkeiten des
Handle-Systems auch zu einem gewissen Grad. De facto betreiben
vermutlich nur die Registration Agencies (Crossref, Datacite, mEDRA
usw.) die technische Infrastruktur (statt jeder einzelne
DOI-Prefix-"Eigentümer") und haben somit die Kontrolle über die Daten.
Im Grunde kann aber in der Theorie hinter jedem Prefix ein anderer
Handle-Server (Local Handle Registry) stecken.

Mirroring der Daten ist für "Endnutzer" nicht vorgesehen. Das ist
allenfalls Funktionalität in der Sphäre des Betriebs der Local Handle
Registries. "man" kann also wohl Mirrors betreiben, aber das gilt nur
für Subsets der Daten aus und in Abstimmung mit den Betreibern der Local
Handle Registries.

-hwh


PS: Dies alles im Brustton der Überzeugung Vorgetragene ist mein
Wissensstand. Mit etwas Pech - und Glück im Sinne des ursprünglichen
Anliegens - irre ich mich ja auch komplett.

Zur Nutzung des Handle-Systems bei DOIs:
https://www.doi.org/doi_handbook/3_Resolution.html#3.5



Listeninformationen unter http://www.inetbib.de.