[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Wettbewerb: Texterkennung für hist. Handschriften



Liebe Kolleginnen und Kollegen,

im Rahmen des H2020 Projekts READ (Recognition and Enrichment of Archival Documents) veranstalten wir eine Reihe von wissenschaftlichen Wettbewerben rund um das Thema "Handschriftenerkennung". Fuer die "International Conference on Document Analysis and Recognition", 2017 in Kyoto, bereiten unsere Kollegen der Technischen Universitaet Valencia gerade ein Proposal vor, bei dem die Teilnehmer erstmals dank der tatkraeftigen Unterstuetzung der Alfred Escher Stiftung ca. 10.000 transkribierte Seiten zum Training erhalten werden (siehe: https://www.briefedition.alfred-escher.ch/). Das Datenset besteht aus mehr als 200 Schreibern und sollte somit schon einigermassen repraesentativ fuer Handschriften der zweiten Haelfte des 19. Jahrhunderts sein.

Um aber testen zu koennen, wie gut die jeweiligen Modelle die auf dem Alfred Escher Set trainiert wurden, fuer Handschriften funktionieren, die NICHT Teil des Trainingssets waren, wuerden wir ein Testset von ca. 10-20 SChreibern des 19. Jahrhunderts bzw. bevorzugt der zweiten Haelfte des 19. Jahrhunderts benoetigen. Pro Schreiber waeren ca. 5-10 Seiten ausreichend, die Seiten koennen auch aus verschiedenen Dokumenten stammen. Falls Transkriptionen vorhanden sind, ist das sehr gut, falls nicht, kein Problem, dann werden wir die Transkription im Rahmen des Projekts durchfuehren.

Fuer alle die sich an dieser Aktion beteiligen moechten ergibt sich damit die seltene Gelegenheit zu sehen, welche Ergebnisse die besten Forschungsgruppen weltweit auf den "eigenen" Dokumenten erzielen. Voraussetzung ist allerdings, dass die Dateien frei zur Verfuegung stehen - sie werden Teil des Datensets sein, das dann auf Zenodo (http://zenodo.org/) der weiteren Forschung zur Verfuegung gestellt werden wird.

Falls Sie Interesse haben, bitte ich Sie mich direkt zu kontaktieren:

Guenter Muehlberger <guenter.muehlberger@xxxxxxxxxx>

Mit den besten Gruessen,

guenter muehlberger

--
Mag. Dr. Guenter Muehlberger
Innsbruck University
Digitisation and Digital Preservation (DEA)
Innrain 52 / 6020 Innsbruck / Austria
Phone: ++43-512-507-8454

http://germanistik.uibk.ac.at/dea/
http://read.transkribus.eu/


Listeninformationen unter http://www.inetbib.de.