[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Freidok. Google. OCRopus



Klaus Graf schrieb:

Google entnimmt, wie hinreichende
Beispiele zeigen, diesen Freidok-Dokumenten den Text

Nur der Vollständigkeit halber:
Google indexiert auch Bilder aus freidok


Vener-Beitrags von mir nicht das
geringste, er war lediglich ein Beispiel.

KG


War aber ganz OK, das Bsp., und es kam einiges an Infos zusammen im 
Kontext zu freidok, metager, base, kpdf, ...


Noch zur Software mit der Google die PDF-s scannt und indexiert:

"

OCRopus(tm) is a state-of-the-art document analysis and OCR system, 
featuring pluggable layout analysis, pluggable character recognition, 
statistical natural language modeling, and multi-lingual capabilities.

The OCRopus engine is based on two research projects: a high-performance 
handwriting recognizer developed in the mid-90's and deployed by the US 
Census bureau, and novel high-performance layout analysis methods.

OCRopus is development is sponsored by Google and is initially intended 
for high-throughput, high-volume document conversion efforts. We expect 
that it will also be an excellent OCR system for many other applications.

"

via google


MfG,
K.

max140 zum schmunzeln, wer mag kann ummodeln ...
Kunde in Buchhandlung: "Guten Tag ich suche 'Der Mann, das überlegene 
Wesen'" - Buchhändlerin: "Schauen Sie mal in der Märchenabteilung"
via twitter

-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.