[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Hinweise erbeten: Maschinelle Verarbeitung vonLiteraturlisten (Referenzen)



Lieber Herr Weichselgartner, 

zwei Hinweise:

a) Dienstleister

z.B. das Satzrechenzentrum in Berlin , Kontakt Frau Fischer oder Herr Stahl.

http://www.srz.de

b) Software:

http://www.primerecognition.com/

Primerecognition koennen Sie selbst betreiben oder in den USA Scannen lassen.
Die Ergebnisse sind um KLASSEN besser als die Ergebnisse bei normalen Desktop -
Produkte bekommen.

Primerecognition ist für mein Dafürhalten das beste Produkt am Markt, nennt aber
keine
Referenzkunden in Deutschland. Die OCR - Ergebnisse sprechen aber für sich.

Grundsätzlich sind die Ergebnisse natuerlich stark von den Vorlagen abhängig und
über welche Mengen gesprochen wird.

Mit freundlichen Grüssen

D.Bussmann
-- 
Dietmar Bussmann
Max Planck Institute for Comparative Public Law
and International Law
Im Neuenheimer Feld 535; D-69120 Heidelberg
Phone: +49 6221 482 273; Fax: +49 6221 482 278

-----Original Message-----
From: inetbib-bounces@xxxxxxxxxxxxxxxxxx
[mailto:inetbib-bounces@xxxxxxxxxxxxxxxxxx] On Behalf Of Erich Weichselgartner
Sent: Tuesday, March 04, 2008 12:27 PM
To: Internet in Bibliotheken
Subject: [InetBib] Hinweise erbeten: Maschinelle Verarbeitung vonLiteraturlisten
(Referenzen)

Liebe Liste,

im Rahmen eines Projektes möchten wir Literaturlisten (Referenzen)
maschinell erfassen (Scannen, OCR, Strukturanalyse, Extraktion der
Teileinheiten). Beispiel:

Literaturliste (Ausschnitt)

Luck, S.J., & Vogel, E.K. (1997). The capacity of visual working memory
for features and conjunctions. Nature, 390, 279-281.

Miller, G.A. (1956). The magical number seven, plus or minus two: Some
limits on our capacity for processing information. Psychological Review,
63, 82-97.

Erfassung und Zerlegung

a) Die Literaturliste wird gescannt (Tipps für Scanner und Bildparameter
willkommen!)

b) OCR-Erkennung (Abbyy?)

c) Strukturanalyse und Zerlegung der Liste in einzelne Referenzen (im
Beispiel zwei Stück)

d) Zerlegung einer Referenz in ihre Teileinheiten.
Am Beispiel oben: Autor 1 = Luck, S.J.; Autor 2 = Vogel, E.K.; Jahr =
1997; Titel = The capacity of visual working memory for features and
conjunctions; Zeitschrift = Nature; Band = 390; Seiten = 279-281.

Meine Fragen: Gibt es schon fertige Lösungen dieser Art (Scannen, OCR,
Parsen)? Falls nicht, welche Institute (oder Firmen) im Bereich
Bildverarbeitung/Mustererkennung besitzen Expertise für diese Aufgabe?
Wer hätte evtl. Interesse (ggf. als Auftrag)?

Für Hinweise wäre ich sehr dankbar.

Mit freundlichen Grüßen,
Erich Weichselgartner
wga@xxxxxxx






Listeninformationen unter http://www.inetbib.de.