[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] BibTeX, JabReF, Xmldump [was: BibTeX, JabReF, Zotero ...]



Jakob Voss schrieb:

Hallo!

>>>> Ein Konverter PICA-BibTeX wäre eine feine Sache...
> [...]
>> Wenn ich XML habe ist der Spass ja schon vorbei, die ganze
>> Arbeit getan. Da habe ich ja dann ordentlich strukturierte
>> Daten in einem einfach zu parsenden Format.
>
> Nunja, die Komplexität der Umsetzung von einem ordentlich
> strukturierten Format in ein anderes ordentlich strukturiertes
> Format kann eigentlich nur unterschätzt werden, da hilft auch
> erstmal kein XML.

Insofern als man natuerlich alles darstellen koennen muss.
Nur wenn ich XML habe kann ich daraus mit sowas wie xpath
o.ae.  recht problemlos die Datenwerte ermitteln und muss
sie "nur noch" (da haben Sie recht) in die passenden Felder
fuellen. Da bin ich genau deswegen auch hinreichend weit
entfernt davon nachvollziehen zu koennen warum XML
sooooooooo viel toller ist als jedes andere strutkurierte
Format und dokumentierte Format. Aber s' ist halt abstrakt
genug und s' gibt mittlerweile genug "generische" Parser
dafuer, die mir aus irgendeinem XML-File die Daten
extrahieren.

>> Zu den MBW:
>>
>> Hier ist das Grundproblem die komplette Titelaufnahme incl.
>> der Vernknuepfungen, aus einer PPN zu machen. Dazu muss ich
>> die Verknuepfungen mit den ueber/untergeordneten
>> Datensaetzen aufloesen. Das ich ein MBW habe sehe ich aber
>> erst wenn den Datensatz schon habe, dann muesste ich die
>> Datenbank noch mal abfragen und die anderen Stufen
>> einsammeln, und ich muss ggf. irgendwie finden wieviele es
>> eigentlich gibt, und was die zugehoerigen PPNs sind. (Z.B.
>> wenn ich eine f-Stufe habe und alle anderen zugehoerigen
>> auch moechte, incl. der TA der c-Stufe.) Das entspricht dem
>> Problem bei einer Bibliographie.
>>
>> Mit ein bisschen Aufwand kann man den WebOPAC abfragen, sich
>> dort PICA+ aus der Datenbank geben lassen, das zerpfluecken
>> (was prinzipiell fast einfacher ist als das normale
>> diagnostische Format), aber man hat immer noch das Problem
>> alle relevanten verknuepften Datensaetze zu finden.
>
> Ich versteh was "f", "TA" und "c" betrifft zwar gerade nur Bahnhof,

TA = Titelaufnahme

Bei f und c sind wir an dem Punkt der vollkommen
missverstanden wurde als ich von PICA sprach. Mit PICA
meinte ich _NICHT_ irgendeine Darstellung im WebOPAC das
irgendein Benutzer sieht sondern das originaere Format in
dem man in PICA Katalogisiert. Kategorienummer und
Datenwerte. Sozusagen die rohe Datenbank. Fuer meine Scripte
produziere ich den Input aus der WinIBW durch drucken des
diagnostischen Formats in ein File. Und da kommen wir zu c
und f bei Mehrbaendigen Werken. c waere die Uebergeordnete
Titelaufnahme, f (oder F) dann ein einzelner Band. Die
Vielcherl heissen ja einfach so. Und das muesste ich
aufloesen wenn ich mein Zeigl endnutzerfaehig und perfekt
machen wollte, was der Kollege ja vorschlug.

> aber mit einer API zum Sammeln von verknüpften Datensätzen
> aus PICA-Katalogen könnte ich vielleicht dienen. Damit
> lässt sich zum Beispiel sowas hier entwickeln:
> http://www.gbv.de/wikis/cls/GBVista und das "bisschen
> Aufwand" sind nur noch einige Zeilen Code.

Ja, wenn ich das habe kann ich das nachvollziehen. Das fehlt
meinen Scripten weil ich's fuer meine speziellen Sachen
bisher nicht gebraucht habe, und das ja nicht ganz trivial
ist.

> Die Entwicklung einer PICA-API (bzw. die Konsolidierung
> der bereits bestehenden Schnittstellen zu PSI) ist in der
> VZG in Arbeit, allerdings kann ich keine genauen
> Zeitangaben machen, da das Tagesgeschäft ja auch noch
> erledigt werden muss.
>
> Wenn sie Interesse haben und vor etwas Perl-Programmierung
> nicht zurückschrecken, setzen sie sich doch einfach mal
> mit mir in Verbindung.

Haette ich glatt, und richtig Angst hab' ich vor Perl nicht.
Ist ne huebsche sprache mit lauter lustigen Zeichen. Endlich
mal was wo man alles braucht was so auf ner Tatstatur
rumliegt ;)

--

Kind regards,

Alexander Wagner
Universitaetsbibliothek Ilmenau
Langewiesener Str. 37
98693 Ilmenau
Tel.: 03677/69-4625 , Fax.: 03677/69-4617



Listeninformationen unter http://www.inetbib.de.