[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Konversionen in HTML



[Wegen eines Fehlers beim Mail-Server MAISER wurde zuvor leider
nur der erste Absatz dieser E-Mail uebermittelt.  Hier kommt nun
die vollstaendige Fassung.  -br]


Paul Kuhn:

> An der Universitaetsbibliothek Konstanz soll auf das Online-Angebot
> wenigstens der am Ort entstandenen Publikationen mehr Anstrengung gerichtet
> werden. Dabei werden uns Textfiles unterschiedlichster Herkunft uebergeben.
> Unsere Zielvorstellung ist, dass die Texte, wenn schon nicht im HTML-Format
> erstellt,  dann doch in vertretbarer Zeit konvertiert und fuer die
> WWW-Praesentation aufbereitet werden.
> Wer hat in dieser Hinsicht bereits Erfahrung? Insbesondere wuesste ich gern,
> wie komfortabel in LaTex erstellte Dokumente in HTML gewandelt werden koennen

In der Regel wird man die automatischen Konversionen nachbearbeiten
wollen/muessen.  Sei es, dass einem die Verweistexte in den Hyperlinks
nicht gefallen (weil optisch zu lang oder inhaltlich zu wenig
praegnant), oder sei es, dass der Konverter mit den deutschen
Umlauten nicht zurechtkommt.

Letzteres trifft beispielsweise auf LaTeX2HTML zu.  Dabei beziehe
ich mich auf die 95er Version.  Nikos' 96er Version habe ich noch
nicht getestet.

Das soll nicht heissen, dass solche automatischen Konvertoren nichts
taugen.  Jeder, der schon einmal versucht hat, einen Text von Hand
nach HTML umzusetzen, weiss, wieviel Arbeit das ist (da ist schnell
mal ein Vormittag weg), und dass ein solcher Konvertor einem den
groessten Teil davon abnimmt -- aber eben nicht alles.

Fuer den Rest benoetigt man solide Grundkenntnisse sowohl in der
Ausgangssprache (z.B. LaTeX) als auch in der Zielsprache (also
HTML).  Selbst wenn es nur um ein Dokument geht, spart man eine
Menge Zeit, wenn man Textwerkzeuge wie awk oder sed zum automatischen,
schablonenhaften "Editieren im grossen Stil" einsetzt, also zum
Beispiel um alle Umlaute von einem Format in das andere zu
uebersetzen.

(Textwerkzeuge wie awk und sed stammen aus der Unix-Welt, sind aber
in der jeweiligen GNU-Distribution auch fuer DOS/Windows oder OS/2
verfuegbar.)

Ich wuerde sagen, dass man an einer *automatisierten* Nachbearbeitung
nicht vorbeikommt, wenn man einen ganzen Satz von Dokumenten "am
Fliessband" konvertieren will -- es sei denn, man hat eine Woche
lang oder mehr nichts Besseres zu tun.  Gluecklich ist, wer dann
auf einen Unix-Wizard zurueckgreifen kann, der einem mit ein paar
Shell/sed/awk/Perl-Skripten den Tag (will sagen: die Woche) rettet.

Zu den bislang ge'post'eten URLs bliebe noch zu ergaenzen:  Es gibt
fuer LaTeX-Texte auch einen math2html-Konverter, eine Erweiterung
von LaTeX2HTML.  Denn leider wandelt LaTeX2HTML mathematische
Formeln einfach nur in gif-Bilder um.  Math2HTML hingegen wandelt
die LaTeX-Formeln in ein HTML-3-DTD-konformes Format um.  Dieses
Werkzeug macht Sinn, da ein grosser Teil der LaTeX-Texte
intentionsgemaess mathematischen Inhalts ist.

Die aktuelle Version von math2html ist 1.3.  Die URL habe ich
gerade nicht zur Hand.  Ich suche sie aber auf Anfrage gerne
heraus.

Fuer Rueckfragen stehe ich natuerlich auch gerne zur Verfuegung.

-br

--
Bernd Rosauer
br _at__ netland.sub.de



Listeninformationen unter http://www.inetbib.de.