[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Mehr als 100 deutsche Repositories in BASE / NeueFeatures im BASE Lab



Lieber Herr Kalok,

Am Mittwoch, 11. Juli 2007 15:37 schrieb Lothar Kalok:
Lieber Herr Pieper,
zu den von Ihnen genannten beeindruckenden Zahlen: gibt es
eine Abschaetzung, wie viele der Dokumente sind tatsaechlich
frei zugaenglich sind?


Mit Ihrer Frage sprechen Sie ein wichtiges Problem an, das auch im 
DRIVER-Umfeld diskutiert wird und dazu geführt hat, dass in den 
DRIVER-Guidelines 

http://www.driver-support.eu/documents/DRIVER_guidelines_1%200.pdf

von den OAI-Data-Providern, eine Set-Definition gefordert wird, die die 
Unterscheidung z.B. in frei zugängliche und nicht frei zugängliche 
Dokumente erlaubt, damit von OAI-Service-Providern gefiltert werden kann. 

Es kommt auch vor, dass Provider ihre Politik nachträglich ändern, d.h. 
dass Dokumente auf einmal frei zugänglich sind, die es vorher nicht waren, 
oder umgekehrt. Das bekommen wir sicherlich nicht in jedem Fall mit und 
schon gar nicht, wenn keine entsprechende Set-Definition vorhanden ist.

Aus BASE-Sicht einige Beispiele, die zeigen sollen, dass wir uns mit dem 
Problem beschäftigen. Das ist übrigens auch eine Erklärung dafür, warum 
wir im Vergleich zu OAISTER oder scientificcommons.org  weniger Quellen 
und Dokumente im Index haben, weil wir versuchen, Provider, die 
ausschließlich Metadaten oder ausschließlich nicht frei zugängliche 
Dokumente anbieten, nicht in BASE aufzunehmen. Das kann sich aber, wie 
gesagt, immer ändern, und wie soll man mit  unterschiedlichen Anteilen von 
frei und nicht frei zugänglichen Dokumenten in einem Respository umgehen, 
wenn es keine Selektionsmöglichkeit gibt?


Hier ein paar Beispiele:

Die Fraunhofer-Gesellschaft bietet Fraunhofer-Publica und 
Fraunhofer-Eprints an, in Publica sind (auch) reine Nachweisdaten drin 
(das ist ja auch völlig ok, die wollen/müssen möglichst sämtliche - auch 
kostenpflichtige - Publikationen ihrer Einrichtung nachweisen), nur in 
Fraunhofer-Eprints kommen Sie immer direkt auf den Volltext. In 
openarchives finden Sie natürlich beide OAI-Schnittstellen.

Von ca. 120 digizeitschriften sind z.Zt. rund 60 frei zugänglich. Anhand 
der Set-Definition ist eine Unterscheidung auf Dokument-Ebene in frei 
zugängliche und nicht frei zugängliche Dokumente möglich, so dass man aus 
digizeitschriften in BASE  zwei Collections machen könnte, eine mit den 
frei zugänglichen und eine mit den nicht frei zugänglichen Dokumenten. Man 
kann auch die nicht frei zugänglichen gar nicht indexieren, es gibt 
vielleicht auch Nutzer in Institutionen, die Zugriff auf die lizenzierten 
Inhalte haben und erwarten, diese auch in BASE zu finden,  ...

Dann gibt es natürlich das Problem, dass es zu den Metadaten keine 
Volltexte gibt oder der Zugang z.B. auf einen Campus beschränkt bleibt. 
Ein zufällig gewähltes Beispiel: 

http://hdl.handle.net/2003/5924

Was soll man damit machen?

Fazit:

Sich nur auf frei zugängliche Volltexte zu beschränken ist schwer, in 
vielen Fällen wird dies in den Daten nicht angezeigt. Wir können uns nur 
im Vorfeld die Quelle anschauen, aber auch dort kann sich die Politik 
nachträglich ändern. Ich kann z.Zt. nicht sagen, wie hoch der Anteil von 
nicht frei zugänglichen Dokumenten in BASE ist, deshalb steht in unseren 
Texten auch immer "überwiegend frei zugänglich".

Das Ganze ist vielleicht ein schönes Thema für eine unserer nächsten 
Publikationen.

 

Viele Grüße
Dirk Pieper






Listeninformationen unter http://www.inetbib.de.