[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Fraktur via OCR



Hallo Herr Holzbach,

es gibt ein zweites Open-Source-Programm, das Fraktur erkennen kann:
OCRopus. Es befindet sich noch in der Entwicklung. Mehr dazu in der
Wikipedia: https://de.wikipedia.org/wiki/OCRopus
Die aktuelle Version ist schon sehr leistungsfähig (s. Testergebnis
unten), wenn auch nicht besondern benutzerfreundlich. Für diesen Test
mit Fraktur habe ich das mitgelieferte Skript run-test wie folgt
angepasst:

ocropus-sauvola tests/Kant_Breitkopf-Fraktur.png -o temp
ocropus-rpred -m fraktur.pyrnn 'temp/????/??????.bin.png'

Wie man sieht, muss man mehrere Teilprogramme starten. Dafür belohnt
ein fast perfektes Testergebnis auf dem recht synthetischen Testbild:


Schriftbeispiel für die BreitkopfFraktur
Was ist Aufklärung?
Aufklärung ist der Ausgang des Menschen aus seiner
selbst verschuldeten Unmündigkeit. Unmündigkeit ist das
Unvermögen, sich seines Verstandes ohne Leitung eines
anderen zu bedienen. Selbstverschuldet ist diese
Unmündigkeit, wenn die Ursache derselben nicht am
Mangel des Verstandes, sondern der Entschließung und
des Mutes liegt, sich seiner ohne Leitung eines anderen
zu bedienen. Sappere sacs! Habe Mut dich deines eigenen
Verstandes zu bedienen! ist also der Wahlspruch der
Aufklärung.
Immanuel Kant, 18
<<

On Sat, Oct 05, 2013 at 03:53:04PM +0200, Stefan Weil wrote:
tesseract Kant_Breitkopf-Fraktur.png Testergebnis -l deu-frak

Schriftbeispiel für die Breitkopf-Fraktur
Was ist Aufklärung?

Aufklärung ist der Ausgang des Menschen aus seiner
selbst verschuldeten Unmündigkeit. Unmündigkeit ist das
Unvermögen, sich seines Verstandes ohne Leitung eines
anderen zu bedienen. Selbstverschuldet ist diese
Unmiindigkeit, wenn die Ursache derselben nicht am
Mangel des Verstandes, sondern der Entschließung und
des Mutes liegt, sich seiner ohne Leitung eines anderen
zu bedienen. sapere grade! Habe Mut dich deines eigenen
Verstandes zu bedienen! ist also der Wablspruch der
Aufklärung.

Immanuel Kam, 1784

-- 
   Christian Pietsch · http://www.ub.uni-bielefeld.de/~cpietsch/
   Universitätsbibliothek Bielefeld
   LibTec: Bibliothekstechnologie und Wissensmanagement

-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.