[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Kooperation zwischen BSB und google



Rohde Bernd wrote:

Wir haben in diesem Fall einen Abschnitt "Schlüsselbegriffe" - 
was wohl unseren Schlagwörtern entspricht, diese vermutlich 
nicht dadurch gewonnen, dass sie von einem Fachreferenten 
vergeben werden, sondern maschinell aus dem Text entnommen sind. 

Und mit Algorithmen die **sicher künftlich verbessert** werden.  
Für Werke auf schwedisch, z.B. 
http://books.google.com/books?id=mnsCAAAAQAAJ
sind diese "key words and phrases" fest nur Präpositionen, also 
einfach die häufigst vorkommende Wörter der Sprache:

  för, motsats till, yttre, ett ord, eller, dem som, formen, men 
  till, inre, ord och, icke, med andra, innefattar, den som, äfven

d.h.: für, Gegensatz zu, äußere, ein Wort, oder, die, Form, aber 
zu, innere, Wort und, nicht, mit anderen, inkludiert, wer, auch

:-)


Solche "Textmining"-Algorithmen sind Googles Stärke.  Schon acht 
Jahren haben sie diese Algorithmen auf Webseiten geübt, und nun 
auch auf älteren eingescannten Büchern mit unvollständiger OCR.  
Katalogisierung, Bibliografie und Intertextualität (wer hat dieses 
geschrieben, wann, warum, für wen, und mit welchen Influenzen?) 
ist (noch) nicht Googles Stärke.  Wer diese Stärken besitzt 
(ProQuest? OCLC?) und genug Geld, kann Google kaufen. Oder wird 
vielleicht von Google gekauft.


-- 
  Lars Aronsson (lars@xxxxxxxxxxx)
  Aronsson Datateknik - http://aronsson.se



Listeninformationen unter http://www.inetbib.de.