[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Gescannte Aufsaetze, Teil 2



Empfaenger : edlef _at__ ed.heide.de
Absender   : roland.steiner _at__ ub.uni-tuebingen.de  (Roland Steiner)
Betreff    : Re: Gescannte Aufsaetze
Datum      : Mi 17.04.96, 15:14  (erhalten: 17.04.96)
Groesse    : 2049 Bytes
----------------------------------------------------------------------
Hallo Herr Stabenau,

> ich  suche  Infos  ueber  gescannte  Aufsatzkopien

an der UB Tuebingen bieten wir im Rahmen des SSG-S-Lieferservice 
(DFG-gefoerderter Direktlieferdienst fuer die SSGs Theologie, 
Religionswissenschaften, Orient u.a.) gescannte Aufsatzkopien an, die 
wir entweder zur Abholung per FTP bereitstellen oder als Anhang an 
eine e-mail schicken.

Wir bearbeiten die Aufsaetze NICHT mit OCR-Software (der Aufwand
waere m.E. immens) und liefern je nach Kundenwunsch die Formate BMP, GIF,
TIF, wobei TIF das praktikabelste zu sein scheint. 

Der Arbeitsaufwand uebersteigt um einiges den, der beim Kopieren und
anschliessenden Post- bzw. Fax-Versand anfaellt. Mit unserer Hard-
und Software werden die Aufsatzseiten einzeln gescannt, dann nach
einem bestimmten Namens-Schema abgespeichert, komprimiert und als
e-mail-Anhang verschickt bzw. zur Abholung per FTP bereitgelegt.

Grafiken werden bei uns einfach mitgescannt, die Qualitaet ist
entsprechend schlecht. Bisher hatten wir kaum Probleme mit Grafiken,
was wohl an unserer Klientel liegt.

Sie haben recht: die Groesse der Bilddateien macht den meisten Kunden
zu schaffen (sowohl bei Beschaffung uebers Netz als auch bei
Drucken) sowie die Tatsache, dass diese bei e-mail-Lieferungen vor
dem Versand uu-codiert und nach Empfang vom Kunden wieder decodiert
werden muessen 

Fazit: wir bieten die elektronische Lieferung gescannter Aufsaetze 
zwar an, raten aber nur unseren EDV-erfahrenen Kunden dazu und 
empfehlen in jedem Fall FTP.

Da auch wir diesen Service erst seit ein paar Wochen anbieten und
deshalb noch nicht DIE grosse Erfahrung haben, waere es toll, wenn
Sie eine Zusammenfassung der Antworten, die Sie bekommen haben, an
uns oder noch besser an die Liste schicken koennten. 

Das Wetter: Sonne satt in Tuebingen :-)

Viele Gruesse
............................................
Roland Steiner
Universitaetsbibliothek Tuebingen
SSG-S / Datenbankdienste
Tel.: 07071/29-6999
............................................
******************************************************************
Empfaenger : edlef _at__ ed.heide.de
Absender   : Schilling _at__ StUB.uni-frankfurt.de  (Helmut Schilling)
Org.-Empf. : INETBIB _at__ ub.uni-dortmund.de
Antwort an : INETBIB _at__ ub.uni-dortmund.de
Betreff    : Re: Gescannte Aufsaetze
Datum      : Mi 17.04.96, 16:13  (erhalten: 17.04.96)
Groesse    : 2924 Bytes
----------------------------------------------------------------------

Liebe Liste,
die UBs in Goettingen, Tuebingen und Saarbruecken und die 
Senckenbergische Bibliothek in Frankfurt haben inzwischen Erfahrungen mit 
gescannten Aufsaetzen gesammelt.

Bei der Senckenbergischen Bibliothek sieht es momentan so aus:


On 16 Apr 1996, Edlef Stabenau wrote:

> ...  Arbeitsaufwand

Bisher ist der Arbeitsgang noch nicht zur Routine geworden. Der
technische Aufwand, der notwendig ist, um einen Aufsatz auf den Weg zu 
bringen ist hoeher als im herkoemmlichen Kopierdienst.


> Wenn  ich  eine  Seite einscanne, erhalte ich ja ein "Bild",
> wird dieses geliefert oder  wird noch mit einer OCR-Software
> "druebergegangen"?  Kann ich  als  Kunde  das  Format  (bmp,
> pcx...)aussuchen?

Geliefert wird das Bild. Bei uns war nicht daran gedacht, eine
OCR-Software einzusetzen, vor allem wegen Abbildungen, unter-
schiedlichen Schriftgroessen und Schriftarten (z.B. Fussnoten ...)
Wir liefern momentan BMP, experimentieren aber auch mit anderen
Formaten.

> Was ist mit evtl.  enthaltenen  Grafiken,  erhalte  ich  das
> Ganze   dann  automatisch  als  pdf-File  oder  werden  diese
> ausgelassen?

Siehe oben. Die ganze Seite wird komplett gescannt.

> Wird diese Form  der Lieferung viel angefragt,
> oder haben die Kunden lieber eine Kopie (bzw. Fax)?

Bisher keine Erfahrungen, weil wir bisher immer nur experimentiert haben.

> Es  waere  nett, wenn hier mal jemand, der so etwas anbietet
> ein paar Eindruecke ueber  den (zusaetzlichen?)  Aufwand der
> elektronischen Bereitstellung mitteilen koennte.

Bis jetzt: Gehirnschmalz. Es ist zu lernen der Umgang mit dem PC,
mit dem Hochschulrechenzentrum, mit dem Netz, Telnet, FTP, ein bisschen
UNIX, ein bisschen Bildverarbeitung, der Umgang mit KollegInnen, die
wissen wollen, warum es immer noch nicht geht.

> Nach  meinen  eigenen   (privaten)   Erfahrungen   ist   das
> einscannen   und   weiterverarbeiten   von   Texten  relativ
> muehselig,   zumindest   wenn   man   es   mit   verschieden
> Schrifttypen zu tun hat.  Wenn das Ganze allerdings als Bild
> geliefert wird, hat  natuerlich  der  Kunde  die Arbeit 8-).

Der Kunde soll auch seinen Spass haben.

> Allerdings wurde mich als Kunden natuerlich dann die Groesse
> der Datei (zumindest wenn ich sie  uebers  Modem  beschaffe)
> abschrecken...

Die "Bilder" werden komprimiert - bei uns mit LHA oder ARJ - damit
der Schreck nicht zu gross wird. Auf der Festplatte muss aber noch
Platz sein. Wenn die Bildchen ausgepackt sind, kommt schon das eine oder 
andere MB zusammen.

Ohne Wetterbericht,
tschuess
h

-----------------------------------------------------------------------------
Helmut Schilling                      e-mail: schilling _at__ stub.uni-frankfurt.de
Senckenbergische Bibliothek           Tel.: +49 (0) 69-798-28244
-----------------------------------------------------------------------------
*****************************************************************************
Empfaenger : edelf _at__ ed.heide.de
Absender   : schroeder _at__ TIB.Uni-Hannover.DE  (Antje Schroeder)
Betreff    : Re: Gescannte Aufsaetze
Datum      : Mi 17.04.96, 14:21  (erhalten: 17.04.96)
Groesse    : 7352 Bytes
----------------------------------------------------------------------
At 19:37 Uhr 16.04.1996, Edlef Stabenau wrote:

>Hallo Inetbib,
>
>ich  suche  Infos  ueber  gescannte  Aufsatzkopien

[...]

Hallo, Edelf Stabenau!

In der TIB beschaeftigen wir uns schon seit einiger Zeit mit
"elektronifizierten" - sprich gescannten Dokumenten, wie wir sie genannt
haben - speziell fuer die Dokumentlieferung. Wir haben im Aufbau ein
automatisiertes Dokumentliefersystem, das alle Schritte von der
Dokumentbestellung, ueber das Scannen, eine Auftragsverwaltung mit
Erstellung von Lieferscheinen und Rechnungen sowie die Dokumentlieferung
automatisiert.

Weitestgehend realisiert und in einem Test-Betrieb sind bisher Lieferarten:
Fax (automatisch ueber Fax-Server) und Ausdruck vor Ort mit
Briefpostlieferung. Ich weiß: damit tragen wir den neuen Entwicklungen der
Datenkommunikationsnetze noch nicht Rechnung. Entsprechende Loesungen sind
im Grobkonzept jedoch bereits fertig und warten auf Realisierung ... Als
großer Dokumentlieferant sind wir jedoch daran interessiert, von vorn
herein Loesungen zu finden, die auch noch bei einem grossen Bestellvolumen
einsetzbar sind. Das braucht eben seine Zeit.

Uebrigens: das System umfaßt bisher KEIN Archiv - aus urheberrechtlichen
Gruenden; d. h. wir werfen alle gescannten Seiten nach Auslieferung wieder
weg!

Soweit zu dem Umfeld, aus dem ich berichten kann. Ich will hier nur auf die
Scann-Funktionen eingehen, bin aber gern bereit zu der ganzen Anwendung,
die im Rahmen eines BMBF-Projekts entstanden und inzwischen weitestgehend
abgeschlossen ist, weitere Informationen zu liefern.


Fuer das Scannen setzen wir Buchscanner ein: z. Zt. nur von der FA. KODAK
(Model Bookscanner 200), da andere bisher nicht mit einer offenen
Schnittstelle verfuegbar sind/waren. Hier zeichnen sich jedoch weitere
Entwicklungen ab, die wir intensiv verfolgen. Flachbettscanner werden nur
in Einzelfaellen eingesetzt; v. a. sollen sie nicht fuer die
Masschenproduktion (die TIB produziert derzeit taeglich ca. 15.000 bis
18.000 Kopien im Format DIN A4) zum Einsatz kommen. Die ergonomischen
(unser Personal arbeitet dabei im Sitzen) und buchschonenden Vorteile von
Buchscannern wollen wir unbedingt nutzen. Der Buchscanner ist ueber ein
SCSI Interface an einen PC angeschlossen. Auf diesem PC laeuft ein ganz
einfaches Scan-Programm, das den Buchscanner steuert und zusaetzliche
Funktionen wie Seitenzaehlen leistet. Es ist darauf ausgelegt, in der
Massenproduktion eingesetzt zu werden.

> die  von
>einigen Dokumentenanbietern geliefert werden, und zwar ueber
>das gelieferte Format  und  natuerlich  den  Arbeitsaufwand.
>Wenn  ich  eine  Seite einscanne, erhalte ich ja ein "Bild",

Zur Format-Frage: der Buchscanner liefert Images im Format TIFF 6.0. Diese
Images sind nach CCITT Gr. 4 komprimiert; damit reduziert sich die
Dateigroesse von ca. 1 MB (unkomprimiert) auf ca. 150-180 kB pro DIN
A4-Seite.
TIFF ist das fuer gescannte Dokumente uebliche Format, das im uebrigen auch
in anderen Projekten (EDIL, ...) verwendet wird.

Zum Aufwand: der eigentliche Scan-Vorgang fuer eine DIN A4 Seite mit
Anzeige am Monitor dauert ca. 10 sec. bei den bei uns eingesetzten
Buchscannern. Das ist gegenueber den bisher bei uns eingesetzten
Mikrofilmkameras (die wir auch fuer die Kopienerstellung einsetzen)
natuerlich ein Zeitverlust. Durch sich anschliessende sehr stark
automatisierte Weiterverarbeitungsverfahren (automatische Erstellung von
Rechnungen etc.) reduzieren wir jedoch einen Grossteil von bisher manuell
erledigten Taetigkeiten und beschleunigen damit unsere Dokumentlieferung.

>wird dieses geliefert oder  wird noch mit einer OCR-Software
>"druebergegangen"?

Eine OCR-Erkennung wird NICHT durchgefuehrt. Wir liefern wie bei "normalen
Kopien" ein echtes Abbild der Vorlage mit allen Abbildungen usw. Mit Hilfe
von OCR kann nur der Text erfaßt werden, Abbildungen, Zeichnungen,
Graphiken muessten dann nochmal in separaten Dateien zusaetzlich geliefert
werden. Vorteil von OCR-Verfahren: Reduzierung der Dateigroesse;
Recherchierbarkeit des Volltextes (jedoch aus meiner Sicht mit grosser
Vorsicht anzuwenden). Ausserdem ist der Aufwand fuer eine solche
"Nachbearbeitung" zu gross.

>  Kann ich  als  Kunde  das  Format  (bmp,
>pcx...)aussuchen?

Gilt nur fuer die geplanten elektronischen Dokumentliefermoeglichkeiten:
Nicht geplant. Die gescannten Dokumente werden im TIFF-Format geliefert.
Selbstverstaendlich muss dann von Seiten der Bibliothek dafuer gesorgt
werden, dass fuer alle Rechnerplattformen entsprechende Viewing- und
Print-Programm z. B. auf einem FTP-Server zum Abruf zur Verfuegung gestellt
werden.

>Was ist mit evtl.  enthaltenen  Grafiken,  erhalte  ich  das

s. o.

>Ganze   dann  automatisch  als  pdf-File  oder  werde  diese

Die Anwendung des PDF-Formats lohnt eigentlich nur dann, wenn z. B. ein
Dokument in einer Textverarbeitung erzeugt wurde, und daraus ein portables
Dokument, das in seinem Aussehen erhalten bleibt (im Gegensatz zu HTML) und
auf verschiedenen Plattformen mit (frei) verfuegbaren Tools angesehen und
gedruckt werden soll. Fuer gescannte Dokumente kommt es nicht zum Einsatz

>ausgelassen?  Wird diese Form  der Lieferung viel angefragt,
>oder haben die Kunden lieber eine Kopie (bzw. Fax)?

Noch keine Erfahrungen mit elektronischer Dokumentlieferung. Die Nachfrage
ist jedoch jetzt schon spuerbar vorhanden.

>Es  waere  nett, wenn hier mal jemand, der so etwas anbietet
>ein paar Eindruecke ueber  den (zusaetzlichen?)  Aufwand der
>elektronischen Bereitstellung mitteilen koennte.

s. o.

>Nach  meinen  eigenen   (privaten)   Erfahrungen   ist   das
>einscannen   und   weiterverarbeiten   von   Texten  relativ
>muehselig,   zumindest   wenn   man   es   mit   verschieden
>Schrifttypen zu tun hat.  Wenn das Ganze allerdings als Bild
>geliefert wird, hat  natuerlich  der  Kunde  die Arbeit 8-).

Wieso? Braucht der denn in jedem Fall den Text als ASCII-Text? Oder reicht
nicht ein Image, aus dem die INFORMATION genauso hervorgeht?


>Allerdings wurde mich als Kunden natuerlich dann die Groesse
>der Datei (zumindest wenn ich sie  uebers  Modem  beschaffe)
>abschrecken...

Das ist bei TIFF-Dateien allerdings ein Problem. Mit Packprogrammen ist bei
TIFF-Dateien auch keine weitere Kompression zu erwarten. Das gleiche gilt
fuer Formate wie Postscript und PDF, die bei elektronischen Dokumenten weit
verbreitet sind (die sich allerdings noch komprimieren lassen). Eine
Loesung haben wir da auch noch nicht. Nutzung von ISDN fuer die
Dokumentlieferung?

Was den Umgang mit elektronischen Dokumenten (z. B. aus dem Internet) - im
Gegensatz zu den elektronifizierent - angeht, ist fuer uns auch vieles noch
Neuland. Fuer weitere Fragen zu den "Scanning"-Geschichten stehe ich jedoch
gern zur Verfuegung.

Mit freundlichen Gruessen

Antje Schroeder
**************************************************************
               Dipl.-Dok. (FH) Antje Schroeder
       Universitaetsbibliothek Hannover und TIB (UB/TIB)
                Abteilung EDV und Neue Medien

Welfengarten 1B                 Tel: (0511)762-4067
D-30167 Hannover                Fax: (0511)71 59 36

E-Mail: Schroeder _at__ tib.uni-hannover.de
**************************************************************


Listeninformationen unter http://www.inetbib.de.