[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Frage zu ORCID



Liebe Frau Höfler, vielen Dank für die weiteren Denkanstöße zur Ableitung 
eines Identifiers aus bekannten Daten!

Ich mutmaße, für den Zweck einer AutorID ist keine perfekte 
Kollisionsresistenz notwendig, aber Kryptografie ist nicht mein Fach.

Ein Ausweg aus dem Geburtstagsparadoxon wäre vielleicht doch die aktuelle 
Emailadresse zu hashen, und aber selbst nach einem Wechsel der Adresse 
bei dem ursprünglich erstellten Fingerprint zu bleiben.

Vielleicht ergibt sich in Wikipedia noch eine prägnante Liste der vielen 
Vorzüge von ORCiD: https://en.wikipedia.org/wiki/ORCID#Uses

Nebenbei, im Wikipediaartikel verlinkt ist Stephen Hawkings ORCiD, offen 
bleibt jedoch, ob er selbst die letzte Änderung tätigte:
Record last modified Oct 20, 2018 2:28:55 AM
http://orcid.org/0000-0002-9079-593X

Marcus


On Thu, 07 Jan 2021 10:33:46 +0100, Gabriele Höfler via InetBib wrote:
Lieber Herr Latour,

ich möchte zu bedenken geben, dass es auch Personen mit gleichem Namen
und gleichem Geburtsdatum gibt (wir haben an der UB Wien vereinzelt
solche Fälle unter den Benutzer*innen meines Wissens). Die Sache ist
leider nicht ganz so einfach. Man könnte sicher einwenden, dass eine
Ergänzung von Geburtsort und anderen Eckdaten die Fälle an
Überschneidungen weiter einschränkt, ganz ausschließen wird man sie aber
nicht können, denke ich. Und selbst wenn, wären mit einem einfachen
Identifier nicht alle Funktionalitäten von ORCiD abgedeckt.

Im Übrigen ist SHA256 meines Wissens mittlerweile geknackt. Insbesondere
wenn der grobe Aufbau bekannt ist, sollte eine Attacke gegen einen so
konstruierten Hash relativ leicht möglich sein. Und genau hier liegt
wohl auch das Problem von derart "sicher" konstruierten UIDs: Keine
kryptografische Lösung ist von Dauer.

Das als kurzen Einwand zu dem "Name plus Geburtsdatum hashen als Primary
Identifier reicht doch" Gedankenexperiment.

Beste Grüße Gabriele Höfler


Am 06.01.2021 um 18:16 schrieb Marcus Latour via InetBib:
Liebe Liste,

vielen Dank Antonia für die ausführlichen Antworten; die eingebrachten
Links böten Lesestoff für viele lange Winterabende. Einen spontanen
Gedanken erlaube ich mir noch zu äußern ohne mehr gelesen zu haben:

Personen mit gleichen Namen an der selben Einrichtung können durch die
Angabe Emailadresse unterschieden werden. Bei Wechsel in eine neue
Arbeitsgruppe oder Namensänderung ändert sich jedoch häufig die
Emailadresse, was also für ein anderes Unterscheidungsmerkmal spricht.
Da Geburtstag und -ort nicht im Klartext in Veröffentlichungen (außer
Promotion?) angegeben werden, hätte der Wissenschaftsrat*) auch eine
nicht-rückrechenbare (Hash-)Kodierung aus Name+Geburt vorschlagen
können;
einen eindeutigen Fingerprint (z. B. sha256sum(Name+Geburt) =
9528fd8a2c76ffa91b935f9fdd30e6dd). So bliebe die Angabe Geburt nicht-
öffentlich, wir hätten jedoch eine ID, die unabhängig eines wie mir
scheint recht kostspieligen Konsortiums erstellt werden könnte aber
ähnlich z. B. in bibliometrischen Fragestellung zur Anwendung kommen
könnte. (Die Erzeugung eines eigenen Fingerprints hätten wir einst in
Wikipedia festlegen können; mit einem Kommandozeilenbefehl oder mit
etwas Javascript online auf einer vertrauenswürdigen Webseite könnte
jede Person ihren eigenen Fingerprint erstellen und in Publikationen
etc. veröffentlichen.)

*) bezugnehmend auf das Zitat auf orcid-de.org/information:
„Aus Sicht des Wissenschaftsrats spricht, da es sich um einen offenen
Standard handelt, vieles für den Einsatz von ORCID (Open Researcher and
Contributor ID) für die Zuordnung von Personen sowie von DOIs (Digital
Object Identifier) zur eindeutigen Identifikation von
Forschungsoutput.“ Wissenschaftsrat: Empfehlungen zur Spezifikation des
Kerndatensatz Forschung
https://www.wissenschaftsrat.de/download/archiv/5066-16.pdf (Der Text
dort verweist weiter auf http://www.wissenschaftsrat.de/
download/archiv/1656-11.pdf, darin ORCID jedoch nicht enthalten.)

Genug der Abschweifungen, vielen Dank für die Beiträge
     Marcus

On Wed, 06 Jan 2021 14:33:51 +0100, Antonia Schrader via InetBib wrote:
Lieber Marcus und Liebe InetBib-Nutzenden,

als Projektpartnerin des ORCID DE Projektes, das die Förderung der
Verbreitung von ORCID iDs sowie in der aktuellen 2. Projektphase die
Konsolidierung der ORCID-Informationsinfrastruktur in Deutschland zum
Ziel hat (mehr unter https://www.orcid-de.org/), möchte ich versuchen
deine Fragen so gut wie möglich zu beantworten:

1. Beispiele Vorteile ORCID bzw. PIDs Durch die Angabe der ORCID iD
können Forschende eindeutig und persistent mit ihren wissenschaftl.
Werken verknüpft werden. Gerade im asiatischen Raum gibt es eine
Vielzahl von Wissenschaftler*innen, die denselben Namen tragen und an
derselben Einrichtung arbeiten (z.B. Wei Wang an der Chinese Academy
of Science, siehe auch https://doi.org/10.5281/zenodo.4071769). Eine
eindeutige Zuordnung, welcher Wei Wang nun das Paper im
Mustermann-Journal veröffentlicht hat, ist mit diesen Angaben nicht
möglich. Weitere Vorteile haben wir unter
https://www.orcid-de.org/information/ aufgelistet.

2. Datenbanken Dies kann ich leider nicht genau beantworten. Bitte
stelle diese Frage an info@xxxxxxxxxxxx,
sodass unsere Kollegin von ORCID direkt antworten kann. Sicherlich
hängt dies auch von der jeweiligen Implementierung ab.

3. Digital Bibliography & Library Project (DBLP)
Hierzu liegen mir leider keine Informationen vor. Wie ich Wikipedia
(https://de.wikipedia.org/wiki/
Digital_Bibliography_%26_Library_Project)
entnehmen kann, ist DBLP nun ein Service des Schloss Dagstuhl. Schloss
Dagstuhl ist seit 01.01.21 Mitglied im ORCID Deutschland Konsortium
und plant somit die Implementierung von ORCID
(https://www.orcid-de.org/schloss-dagstuhl-63-mitglied-orcid-de-
konsortium/).

4. Was sind typische Arbeitsschritte, die durch ORCID erleichtert
werden?
Hier stellt sich zunächst die Frage, welches Einsatzszenarien dir für
die Verwendung von ORCID vorschwebt. Üblicherweise wird die ORCID-API
in das Repositorium, Hochschulbibliografie, FIS,
Identity-Management-System oder Fördersystem von
Forschungseinrichtungen implementiert, bspw. zur
Forschungsberichterstattung oder um den Forschenden der eigenen
Einrichtung diesen Service zu bieten. Wichtig hierbei zu wissen ist,
dass die Implementierung der ORCID-Member-API nicht nur die
Darstellung der ORCID iDs und die Registrierung ermöglicht, sondern
auch den Austausch von Metadaten des eigenen Systems mit dem
ORCID-Registry möglich macht (mehr ggf. hier:
https://info.orcid.org/documentation/workflows/).

5. Webfeed Mit der ORCID-Member-API ist es möglich mit sog. Webhooks
bei Änderungen in den ORCID-Records der Forschenden der eigenen
Einrichtung (z. B. neue Publikationen oder Änderung der Affiliation)
sich benachrichtigen zu lassen. Mehr hier:
https://www.orcid-de.org/konsortium/

6. Mitgliedsgebühr ORCID Inc. ist eine not-for-profit organization und
finanziert ihren Betrieb (Vergabe der ORCID IDs, Betrieb des Registry,
Support etc.) über diese Mitgliedsgebühren. Hier sind Angaben über die
Finanzen von ORCID einsehbar: https://info.orcid.org/our-governance/ .

7. Verlage Entsprechend des DFG-Kodex „Leitlinien zur Sicherung guter
wissenschaftlicher Praxis“ sind Wissenschaftler*innen aufgefordert
‘phasenübergreifende Qualitätssicherung’ zu betreiben. Hilfreiche
Werkzeuge in der Qualitätssicherung digitalisierter Wissenschaft sind
zum Beispiel die „FAIR-Kriterien“ (Forschungsdaten sollen auffindbar –
findable, zugänglich – accessible,interoperabel – interoperable – und
wiederverwendbar – reusable – sein.) für digitale Forschungsdaten und
eben persistente Identifikatoren, wie z. B. der DOI oder die ORCID iD,
weswegen die Nutzung von Letzterem auch immer mehr von Verlagen
verlangt wird.
Unter https://doi.org/10.2312/os.helmholtz.012 hat das Helmholtz Open
Science Office einen Leitfaden zur Umsetzung des GWP-DFG-Kodex
veröffentlicht, wo dies ebenfalls aufgegriffen wird.

8. Popularität von ORCID ORCID ist de facto Standard zur
Personenidentifikation in der Wissenschaft. Diese Entwicklung wurde im
Projektantrag von ORCID DE 1 (https://doi.org/10.2312/lis.16.01), wie
folgt begründet:
“ORCID ist nicht die erste Initiative, die sich dem Thema der
Autorenidentifikation widmet. Die normierte Ansetzung der Namen von
Personen, die an einer Publikation mitgewirkt haben, ist eine
etablierte Technik der Formalerschließung. Während die Landschaft der
Autorenidentifikation viele Jahre durch spartenbezogene Initiativen
geprägt war, verfolgt ORCID einen übergreifenden Ansatz, der durch ein
breites internationales Konsortium getragen wird. ORCID verzahnt sich
zudem mit dem International Standard Name Identifier (ISNI).”
In Deutschland wird zudem insbesondere die Verzahnung von GND und
ORCID iD durch das ORCID DE Projekt vorangetrieben (vgl. u. a.
https://www.orcid-de.org/orcid-claiming-gnd/).
Ggf. lässt sich der Erfolg von ORCID auch auf die einfache Handhabung
der Registrierung für die Nutzenden, die datenschutzrechtlichen
Aspekte (siehe hier: http://doi.org/10.2312/lis.17.02) und den
umfangreichen Support durch ORCID Inc. sowie der nationalen Konsortien
zurückführen.

Ich hoffe, ich konnte deine Fragen beantworten. Bitte zögere nicht,
dich bei weiteren Fragen und Anregungen an
info@xxxxxxxxxxxx zu wenden. Gerne können
wir uns auch digital für ein Gespräch verabreden.

Wenn du dich weiter für ORCID interessierst, empfehle ich dir unsere
Mailingliste „ORCID DE Dialog“
(https://www.listserv.dfn.de/sympa/info/orcid-de-dialog) zu abonnieren
und uns auf Twitter unter #ORCID_DE und @ORCID_Org zu folgen, wo wir
regelmäßig zu ORCID und dem Projekt berichten.

Mit vielen Grüßen aus dem ORCID DE Projekt

-----Ursprüngliche Nachricht-----
Von: InetBib <inetbib-bounces@xxxxxxxxxx>
Im Auftrag von Marcus Latour via InetBib Gesendet: Mittwoch, 6. Januar
2021 12:01 An: inetbib@xxxxxxxxxx
Betreff: [InetBib] Frage zu ORCID

Liebe Kolleginnen,

auf Wikipedia lese ich zu ORCID unter Zweck:

ORCID-iDs sollen die elektronische Zuordnung von Publikationen und
anderen Forschungsaktivitäten und -erzeugnissen zu Forschern
erleichtern.
Dies ist aufgrund der Personennamen alleine nicht sicher möglich, da
verschiedene Autoren gleiche Namen haben können, Namen sich ändern
können (beispielsweise bei Heirat), und wegen Schreibvarianten
(beispielsweise einmal die ausgeschriebenen Vornamen, ein anderes Mal
aber nur die Initialen).
Zudem erleichtern Identifikatoren die maschinelle Datenverarbeitung.

Kennt jemand konkrete Beispiele, wo diese Ziele (wie) umgesetzt sind?

Werden ORCID-Strings (z. B. 0000-0001-5000-0007) in Datenbanken als
Primärschlüssel verwendet?

Das Digital Bibliography & Library Project (DBLP) kommt glaube ich
seit Anbeginn auch ohne ORCID mit Namensvarianten und -änderungen
zurecht.

Was sind typische Arbeitsschritte, die durch ORCID erleichtert werden?

Kann man evtl. Hinweise zu neuen Publikationen einer Verfassserin,
eines Arbeitsgruppe oder Institution per Webfeed abonnieren, so dass
nicht mehr der Webfeed einer Homepage sondern der von ORCID abgerufen
werden muss (sofern der Interessentin an der Verfasserin die ORCID
bekannt ist, woher auch immer)?

Kürzlich las ich eine positiv klingende Meldung, dass eine "Reduktion
der jährlichen ORCID-Mitgliedsgebühr für die kommende Zahlperiode für
alle Mitglieder des Konsortiums von $3.500 auf $3.000 (2.550 €)
ermöglicht wird." Die Websites zu ORCID sind durchaus hübsch, aber
gibt es evtl.
eine Aufstellung, wie diese Gebühren darüberhinaus verwendet werden?

Manche Verlage scheinen inzwischen ORCID als Voraussetzung für die
Aufnahme einer Publikation zu verlangen. Warum?

Zurück zu Wikipedia, genauer, zu eines der vielen spendenhungrigen
Projekte der Wikimedia. Gäbe es mit Wikidata nicht eine etwas
"offenere" Plattform für diese Art der Personenkennziffer? Und davor
gab es vmtl. schon GND und VIAF und andere, evtl. lange bevor 2010
ORCID gegründet wurde. Nun, vielleicht hilft mir jemand, den Grund der
wachsenden Popularität von ORCID zu erkennen. Vielen Dank!

    Marcus





Listeninformationen unter http://www.inetbib.de.