[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Downloads in HTML-Format anpassen an WORD-Format?



Hallo,

Joachim Michel schrieb:
> Wir wollen aus unserem WebOPAC, der auf PICA und WinIBW basiert (wie das
> nun mal bei uns im GBV so üblich ist), Literaturlisten downloaden und
> ausdrucken. Dabei soll das Ergebnis aber schöner werden als der von
> System und Browsern vorgegebenen Standardausdrucke der HTML-Dateien.
[...]
> Hat jemand Erfahrungen wie man am Besten die Downloads konvertiert,
> damit man nicht nur sch=F6ner formatieren, sondern auch passable
> Seitenumbrüche und eine ansprechende Paginierung in WORD durchführen
> kann.

In der Unix/Linux-Welt kann man mit Perl, awk, sed und ein wenig
Skriptprogrammierung eine HTML-Seite automatisch weiterverarbeiten und
z. B. daraus die Nettodaten wieder extrahieren. Diese könnte man dann
beispielsweise in ein Spreadsheet laden und von dort aus weiterverarbeiten,
ggfs. mit weiteren Skripten/Makros. Oder die extrahierten Daten werden
direkt einer - ebenfalls selbst gebastelten - Druckmimik zugeführt,
die "saubere" Tabellen schreibt und z. B. ein PDF daraus generiert.

Sowas läßt sich aber nur fallspezifisch lösen, allgemeinverwendbare
Lösungen gibt es nicht. Die Aufwände je zu verarbeitendem Ausgabeformat
liegen schnell im Bereich mehrerer Tage.


Das ganze ist letztendlich ähnlich, als wenn Sie zunächst ein Schnitzel
durch den Fleischwolf drehen und anschließend wieder zusammensetzen wollen.
Da kommt zwar vielleicht noch ein Hackbraten raus, das Schnitzel sehen
Sie aber nie wieder in ansehnlicher Form. Man kann halt nur mit genügend
Panade versuchen, den beschrittenen Verarbeitungsweg so gut wie möglich
zu kaschieren.

Wenn Sie eine alternative Möglichkeit zur HTML-Ansicht haben, an die
Rohdaten zu kommen (z. B. direkte Datenbank-Abfrage oder Download im
CSV-Format), ist eine weitere Aufbereitung wesentlich aufwandsärmer
und fehlerunanfälliger möglich. Bei Fragen -> persönliche Mail.

Viele Grüße,
Daniel Rödding


-- 
Daniel Roedding                                       phone: +49 5252 9838 0
daniel _at__ roedding.de                                      fax: +49 5252 9838 20


Listeninformationen unter http://www.inetbib.de.