[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

mal wieder: Stopwortlisten



Hallo und guten Tag,

für ein Recherchetool, welches hier als "Feierabendprojekt" schrittweise
aufgebaut wird, suche ich Stopwortlisten für die Sprachen Englisch,
Französisch und gern auch weitere Sprachen. Die Stopwortlisten sollen für
eine Funktion verwendet werden, die automatisch Schlagwort-Vorschläge zu
einem gegebenen Text generiert.

FÜr die Sprache Deutsch funktioniert das ganze mit einer nur ca. 3 KB
kurzen Liste schon erstaunlich gut, im Englischen kracht es aber, weil
noch keine brauchbare Liste vorhanden ist.

Kann da vielleicht jemand hier aus der Runde weiterhelfen?


Zum Hintergrund:

Das System, im Rahmen dessen die Listen verwendet werden sollen, wird
in ein paar Monaten öffentlich verfügbar sein. Es geht letztendlich um
den Aufbau einer neuen Suchmaschine fürs WWW, die im Gegensatz zu den
im Netz vorhandenen Angeboten zwar einen begrenzten Netz-Abdeckungsgrad
haben wird, dafür aber komfortablere Recherchemöglichkeiten anbieten
soll.  Ziel soll sein, tiefergehende Internet-Recherchen in per WWW
erreichbaren Sachtexten zu unterstützten.

Ob das ganze Projekt zum Erfolg führen wird ist noch unklar - Tests in
einem begrenzten Themen- und Seitenfeld haben jedenfalls brauchbare
Ergebnisse geliefert, und ich möchte deshalb die Aktivitäten testweise
ein wenig ausweiten. Vielleicht kommt ja was sinnvolles dabei raus. :-)


Schönes Wochenende,
Daniel Rödding


-- 
Daniel Roedding                                       phone: +49 5252 9838 0
daniel _at__ roedding.de                                      fax: +49 5252 9838 20


Listeninformationen unter http://www.inetbib.de.