[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Rechtschreibung und Suche



Hallo Lars, Hallo Liste,

Lars Aronsson wrote:

Bei Google.de hat man diese Wörter als Synonymen verstanden, aber die Ergebnisse für Fotografien (8,9 Mio) und Photographien (0,96 Mio) unterscheiden sich noch!

Meine Frage war eigentlich ob jemand versucht hat, eine Suchmaschine für die ältere (vor 1901: C, Th) Rechtschreibung zu konstruieren?

Dieses Phänomen tritt besonders bei Eigennamen und Wörtern, deren Schreibweise im Zuge einer Rechtschreibreform verändert wurde, auf.

Um diesem Problem beizukommen, wurde von CONVERA – einem Anbieter von Suchtechnologien – ein patentierter Mechanismus zur Mustererkennung entwickelt. Mit Hilfe des "Adaptive Pattern Recognition Process" ist es der Suchmaschine CONVERA RetrievalWare möglich, relevante Dokumente auch dann zu finden, wenn Suchbegriff und Begriff im Dokument nicht exakt dieselbe Zeichenfolge aufweisen. Gibt der Anwender also beispielsweise den Suchterm „Fotografie“ ein, so findet die Suchmaschine sowohl alle Dokumente, die diese neue Schreibweise enthalten, als auch jene Dokumente, in welchen noch das alte „Photographie“ verwendet wird. Tippfehler bei der Suchanfrage, alte oder neue Rechtschreibung ebenso wie Fehler bei der OCR-Erkennung im Zuge von Scan-Prozessen führen somit nicht mehr – wie bei anderen Suchmaschinen – zu einer Verringerung des Recalls (Vollständigkeit der Suchergebnisse), wodurch die Qualität der
Rechercheergebnisse selbstredend signifikant erhöht wird.

Bei Interesse empfehle ich, sich an meine Kollegin zu wenden unter:
elisabeth.harzhauser@xxxxxxxxxxxxxxxxxxx

Mit besten Gruessen aus einem grauen Wien

Hermann Huemer.

***********************************************************

+ Dr. Hermann Huemer
+ mailto: hermann.huemer@xxxxxxxxxxxxxxx
+ http://www.academicus.info

***********************************************************



Listeninformationen unter http://www.inetbib.de.