[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Volltextverwaltung fuer Linux-Internet-Server



In der Bibliothek der Friedrich-Ebert-Stiftung stellen wir Ueberlegungen
an, um gescannte und mit einer OCR-Software behandelte Broschueren 
ueber eine Volltext-Suche im Internet zugaenglich zu machen.

Formatierte Texte sollen nach unseren Vorstellungen im PDF- oder
HTML-Format, unformatierte als ASCII-Texte archiviert werden. 

Unser Internet-Server laeuft unter Linux, die finanziellen Mittel fuer
eine "richtige" Unix-Workstation werden wir vermutlich nicht haben.

Wir suchen nun Informationen ueber ein Volltext-Retrieval-System, dass
auf einem Linux-Rechner lauffaehig ist und ueber eine CGI-Schnittstelle
angesprochen werden kann.
Die mir bisher bekannten kommerziellen Produkte (z.B. von Dataware)   
liegen leider nicht als Linux-Versionen vor.

Anders als WAIS das (meines Wissens) nach tut, sollte das Programm die
indexierten Texte nicht in eine Source einarbeiten, sondern die Texte
innerhalb der bestehenden Dateistruktur auch fuer andere Anwendungen
zugriffsfaehig halten.

Herzlichen Dank

Walter Wimmer 

=======================================
Walter Wimmer
Bibliothek der Friedrich-Ebert-Stiftung
Godesberger Allee 149
D-53170 Bonn

Telefon: (0228) 883552
Fax:     (0228) 883626
E-Mail:  wimmerw _at__ feshq.dinoco.de
=======================================


Listeninformationen unter http://www.inetbib.de.