[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

AW: WG: SWB: Uebernahme bayerischer Sacherschliessungsdaten abgeschlossen



Sehr geehrter Herr Todt,

danke fuer die Nachfrage - jetzt wird es fuer die Sacherschliesser
interessant.

Auch im SWB werden Schlagwortketten erfasst und in der Tat hat uns die
Datenstruktur vor nicht unbetraechtliche Schwierigkeiten gestellt, besonders
angesichts der Tatsache, dass - im Gegensatz zum BVB - bei uns eine
Verknuepfung von Titelaufnahme bzw. Schlagwortkette und Schlagwortsatz
stattfindet und die Erkennung von Ansetzungsketten realisiert werden musste.
Als Vorgabe galt, dass die Verknuepfung sauber, das heisst ohne Minderung
der Integritaet der Schlagwortstammdatei im SWB zu geschehen hat.

Um das Ergebnis vorweg zu nehmen: das Programm konnte die Zuordnung besser
als zuvor erwartet durchfuehren; ueber fehlerhafte Zuordnungen ist bislang
nichts bekannt geworden; nicht erkannte Schlagworte gab es, die Redaktion
zeigte aber, dass es sich in den allermeisten Faellen um Verwendungen
handelt, die in der SWD gar nicht vorkommen bzw. wo Aenderungen der
Ansetzungen nicht nachvollzogen worden waren (und infolgedessen die
Schlagwoerter nicht zugeordnet werden konnten).

Als Anhang fuege ich einen Ausschnitt aus einer geplanten
Vortragsveroeffentlichung zum BSZ-Kolloquium 2002) an, der den
Grundalgorithmus des Programms etwas erlaeutert. Wenn genauere
Erlaeuterungen gewuenscht werden, stehe ich sehr gerne zur Verfuegung.

Ihnen freundliche Gruesse

Stefan Wolf

+++++++++++++++++++++++++++++++++++++++++++++++++++

Stefan Wolf                    Tel: +49-7531-883050
Bibliotheksservice-Zentrum     Fax: +49-7531-883703
Baden-Wuerttemberg             mailto:stefan.wolf _at__ bsz-bw.de
78457 Konstanz                 http://www.bsz-bw.de/

***************
Ungleich schwieriger gestaltete sich die Ausgangssituation bei der
anstehenden Übernahme der Schlagwortinformation. Zwar ist der BVB seit
Anbeginn Kooperationspartner beim Entstehen der SWD, führt diese aber
bislang nicht als verknüpfte Normdatei. Geliefert konnte deshalb vom BVB nur
werden der reine Ansetzungstext; Identnummern, die Schlagwortart
kennzeichnende Steuerbuchstaben fehlten ebenso wie ein unterscheidendes
Merkmal als Trennzeichen in Ansetzungs- und Verknüpfungsketten.

Geliefert wurde also in MAB2 eigentlich eine bloße Textauflistung - die z.B.
so aussehen konnte:

902 USA
902 Verkehrspolitik
902 Eisenbahn
902 Güterverkehr

Ob dieser Text vier einzelne SWD-Termini darstellt oder eine Ansetzungskette
enthält (z.B. USA / Verkehrspolitik), war den Daten nicht zu entnehmen. Ein
Programm war zu entwickeln, das den gelieferten Text unter fachgerechtem,
aber vielfachem Abgleich an der Schlagwortstammdatei des SWB analysiert und
zuordnet.

Der Grundalgorithmus wurde so gestaltet, dass zunächst versucht wurde, den
ganzen Text als eine Schlagwortansetzung abzugleichen. Konnte diese nicht
gefunden werden, wurde das letzte Glied abgetrennt, der Rest und getrennt
davon das bereits separierte letzte Glied untersucht. Je nach Länge der
Kette wurde so eine wachsende Zahl von Anfragen auf der Datenbank
abgewickelt. Als Ergebnis konnte eine erstaunlich gute Identifizierung von
Schlagworttext und Schlagwortstammdatei erreicht werden. Die im Vorfeld der
Projektdurchführung diskutierte Frage stellte sich nicht mehr wirklich, ob
eine Verknüpfung mit der Schlagwortstammdatei überhaupt erreicht werden
kann, ohne deren Qualität nachhaltig zu beeinträchtigen.

Weitere Unterprogramme waren nötig: so mussten Benutze-Kombination-Hinweise
(auch "Eigentlich Verknüpfungsketten") identifiziert und zur Verknüpfung mit
den eigentlich bezeichneten Einzelschlagworten aufbereitet werden.
Schlagwörter mit Zeitangaben mussten ihrer Gattung (Form-, Sach-,
Zeitschlagwöter) zugeordnet werden. Dies gelang gut dank der RSWK-inhärenten
Systematik der Ansetzung dieser Sachverhalte. Die Unterscheidung von gleich
angesetzten, nur durch den Steuerbuchstaben unterschiedenen Form- und
Sachschlagworten wurde im Regelfall a priori zugunsten des Formschlagwortes
entschieden. In einigen Fällen war es aber sinnvoll, die Voreinstellung
zugunsten des Sachschlagworts vorzunehmen. Die Kennzeichnung neu
entstandener Schlagwortverwendungen war festzulegen, ebenso wie eine
sachgerechte Protokollierung und Statistik des komplexen Gesamtablaufs.
***********



-----Ursprüngliche Nachricht-----
Von: owner-inetbib _at__ ub.uni-dortmund.de
[mailto:owner-inetbib _at__ ub.uni-dortmund.de]Im Auftrag von Günter Todt
Gesendet: Mittwoch, 5. Februar 2003 18:45
An: Internet in Bibliotheken
Betreff: Re: WG: SWB: Uebernahme bayerischer Sacherschliessungsdaten
abgeschlossen




Stefan.Wolf _at__ bsz-bw.de schrieb:

> erfolgreich abgeschlossen wurde am BSZ Baden-Wuerttemberg in der letzten
> Woche die Uebernahme der sachlichen Erschliessungsdaten aus der Datenbank
> des BVB in den SWB. Dabei wurden ... Schlagwortketten nach RSWK/SWD in die
> Titelaufnahmen eingespielt, die vom BVB als zum gleichen Dokument gehörend
> identifiziert worden waren.

Sehr geehrter Hr. Wolf,

da m.W. im bayer. Verbund Schlagwortketten erfasst werden, gibt es das
Problem,
Haupt-Untersatzkonstruktionen, etwa der Art "Deutschland / Grundgesetz" oder
"Wolfram <von Eschenbach/ Parzival" als solche zu erkennen.

(Zumal bei der Erfassung als Schlagwortkette ja auch keine SWD-Ident-Nrn.
anfallen, mit Hilfe derer es natürlich ein leichtes wäre.)

Bei der Datenstruktur einer Schlagwortkette sind daher solche
zusammengehörenden Schlagwörter in formaler Hinsicht nicht mehr zu
unterscheiden
von Abfolgen selbständiger Schlagwörter.


Es würde die bibliothek. Öffentlichkeit sicher interessieren, wie Sie am BSZ
mit
dieser Schwierigkeit umgegangen sind.

Angesichts der Fülle solcher Haupt-Untersatzkonstruktionen ist es ja schwer
vorstellbar, sämtliche dieser SWD-Sätze innerhalb der Ihnen aus Bayern
gelieferten Daten auszusieben.


Mit freundl. Grüßen
--
Günter Helmut Todt
Europa-Univ. Frankfurt (Oder)
e-mail: todt _at__ euv-frankfurt-o.de

"If Bill Gates had a dime for every time Windows crashed...
         Oh, Wait!!  He Does!"



Listeninformationen unter http://www.inetbib.de.