[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Verbundkatalog B3Kat als Linked / Open Data freigegeben



Am 27.12.2011 schrieb Klaus Ceynowa von der Bayerischen Staatsbibliothek:

die Bayerische Staatsbibliothek, der Bibliotheksverbund Bayern und
der Kooperative Bibliotheksverbund Berlin-Brandenburg haben ihren
Katalog "B3Kat" als OpenData im Format MARC-XML <
http://www.bib-bvb.de/open-data.html > und als LinkedOpenData im
Format RDF/XML < http://lod.b3kat.de/download/ > veröffentlicht.
Enthalten sind die Beschreibungen zu über 23 Millionen Medien aus
180 wissenschaftlichen Bibliotheken in Bayern, Berlin und
Brandenburg. Die Daten werden im Int?rnet ?ur allgemeinen Nutzung
unter der Lizenz zCreative Commons Zerooe bereitgestellt. 

Dies ist das umfangreichste Datenpaket, das bisher von deutschen
Bibliotheken und Bibliotheksverbünden als Linked Open Data
zugänglich gemacht wurde. ...

Dieses freie Angebot einer so großen Zahl von Datensätzen reizte die Köche in 
der Allegro-Küche der UB 
der Braunschweiger TU, ihr Programm "allegro-C" ( http://www.allegro-c.de ) 
einem neuen 
Mengenbelastungstest auszusetzen; der bisherige Mengenrekord stand seit 
längerem schon bei 15 Mio. 
Medien, und zwar in Form des museal dahindämmernden Verbundkataloges des 
abgewickelten DBI:  

http://www.biblio.tu-bs.de/db/vk/

Am 6.1.2012 gab Bernhard Eversberg über die Allegro-Liste den Abschluß dieses 
Massentests bekannt - 
24 Mio. Sätze, die hier zu sehen sind:  

http://www.allegro-c.de/db/a30/bvb.htm

Bedienung: 
Bibliothekare, für die es gedacht ist (s. nächster Absatz), werden sich da 
hineinfinden.- Ich z.B. benutze 
vor allem die in der rechten Spalte angebotenen Zugriffe über die Indizes: 
klappe z.B. (oben) das Register 
"VOJ Jahr" auf, gebe (unten) bei "Eingabe" z.B. '1453' ein und sehe dann die 12 
Treffer mit diesem 
Erscheinungsjahr.  

###

Um Mißverständnisse auszuschließen: es handelt sich hier außer um den genannten 
"Massentest" von 
Allegro-Mechanismen um einen praktischen Versuch, bei dem erste Erfahrungen mit 
den von B3KAT 
angebotenen Daten gesammelt werden sollen; keinesfalls soll hiermit ein 
elaboriertes Produkt vorgelegt 
werden, sondern eins mit Ecken und Kanten und nur für die bibliothekarische 
Fachöffentlichkeit gedacht.  

###

Ein paar Daten zu Umfang und Ablauf dieses Tests:

1.
Umwandlung in Parallelverarbeitung:
Ausgangsmaterial: 51 GB MARC-XML-Daten, aufgeteilt auf 39 Dateien
Incl. Erstellung der Schlüsseldatei (in allegro-eigener FLEX-Sprache) und 
einiger Tests dauerte das 1.5 Tage unter Win'7/32; z.B. 7 Dateien
gleichzeitig ca. 70 Min. Gesamtvolumen: 24.161.866 Sätze.

2.
Indexierung mit einer etwas abgespeckten Standard-Indexparameterdatei.
Indexeintraege: 699.016.829
Gesamt-Dateivolumen:   12.6 GB

3.
Bereitstellung unter a30:
Mit Einbau eines Link vom Datensatz zum BVB
Das dauerte fuer die Einrichtung ca. 20 Min.
Näheres zur hier benutzten "a30-Technik" von allegro-C:
http://www.allegro-c.de/doku/a30/


Mit freundlichen Grüßen von

Heinrich Allers

allers@xxxxxxxxxxx * http://www.h-allers.de
Netztagebuch: http://heinrich-erlo-ger.blogspot.com/
Bitácora: http://heinrich-erlo-spa.blogspot.com/
-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.