[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Konversionen in HTML



Paul Kuhn:

> An der Universitaetsbibliothek Konstanz soll auf das Online-Angebot
> wenigstens der am Ort entstandenen Publikationen mehr Anstrengung gerichtet
> werden. Dabei werden uns Textfiles unterschiedlichster Herkunft uebergeben.
> Unsere Zielvorstellung ist, dass die Texte, wenn schon nicht im HTML-Format
> erstellt,  dann doch in vertretbarer Zeit konvertiert und fuer die
> WWW-Praesentation aufbereitet werden.
> Wer hat in dieser Hinsicht bereits Erfahrung? Insbesondere wuesste ich gern,
> wie komfortabel in LaTex erstellte Dokumente in HTML gewandelt werden koennen
.

In der Regel wird man die automatischen Konvertierungen nachbearbeiten
wollen/muessen.  Sei es, dass einem die Verweistexte in den Hyperlinks
nicht gefallen (weil optisch zu lang oder inhaltlich zu wenig
praegnant), oder sei, dass der Konverter mit den deutschen Umlauten
nicht zurechtkommt.

Letzteres trifft beispielsweise auf LaTeX2HTML zu.  Dabei beziehe
ich mich auf die 95er Version.  Nikos' 96er Version habe ich noch
nicht getestet.

Das soll nicht heissen, dass solche automatischen Konvertoren nichts
taugen.  Jeder, der schon einmal versucht hat, einen Text von Hand
nach HTML zu konvertieren, weiss, wieviel Arbeit das ist (da ist
schnell mal ein Vormittag weg), und dass ein solcher Konvertor
einem den groessten Teil davon abnimmt -- aber eben nicht alles.

Fuer den Rest benoetigt man solide Grundkenntnisse sowohl in der
Ausgangssprache (z.B. LaTeX) als auch in der Zielsprache (also
HTML).  Selbst wenn es nur um ein Dokument geht, spart man eine
Menge Zeit, wenn man Textwerkzeuge wie awk oder sed zum automatischen,
schablonenhaften "Editieren im grossen Stil" einsetzt, also zum
Beispiel um alle Umlaute von einem Format in das andere zu
konvertieren.

(Textwerkzeuge wie awk und sed stammen aus der Unix-Welt, sind aber
in der jeweiligen GNU-Distribution auch fuer DOS/Windows oder OS/2
verfuegbar.)

Ich wuerde sagen, dass man an einer *automatisierten* Nachbearbeitung
nicht vorbeikommt, wenn man einen ganzen Satz von Dokumenten "am
Fliessband" konvertieren will -- es sei denn, man hat eine Woche
lang oder mehr nichts Besseres zu tun.  Gluecklich ist, wer dann
auf einen Unix-Wizard zurueckgreifen kann, der einem mit ein paar
Shell/sed/awk/Perl-Skripten den Tag (will sagen: die Woche) rettet.

Zu den bislang ge'post'eten URLs bliebe noch zu ergaenzen:  Es gibt
fuer LaTeX-Texte auch einen math2html-Konverter, eine Ergaenzung
zu LaTeX2HTML.  (LaTeX2HTML wandelt mathematische Formeln einfach
in gif-Bilder um.)  Math2HTML wandelt die LaTeX-Formeln hingegen
in ein HTML-3-DTD konformes Format um.  Dieses Werkzeug macht Sinn,
da ein grosses Teil der LaTeX-Texte intentionsgemaess mathematischen
Inhalts sind.

Die aktuelle Version von math2html ist 1.3.  Die URL habe ich
gerade nicht zur Hand.  Ich suche sie aber auf Anfrage gerne
heraus.

Fuer Rueckfragen stehe ich natuerlich auch gerne zur Verfuegung.

-br

--
Bernd Rosauer
br _at__ netland.sub.de


Listeninformationen unter http://www.inetbib.de.