[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] HatSchonWer: Die GND mit Solr indexiert



Hallo Herr Reh,

wollen Sie Ihre vorhandenen (bereits mit Solr indexierten Daten) 
anreichern oder geht es Ihnen lediglich um ein Retrieval in den von der 
DNB bereitgestellten RDF-Daten?

Im letzteren Fall bin ich mir nicht sicher, ob Solr hier wirklich seine 
Stärken gegenüber ordinären Triplestores ausspielen kann. Es ist 
insbesondere zu bedenken, dass Solr/Lucene die Daten vom Prinzip her in 
einer "flat table" speichert und es daher unmöglich ist, z.B. einen 
klassischen Join mit nur einer Solr-Query abzufeuern. Wenn ich mir die 
RDF-Daten zu Bertolt Brecht (http://d-nb.info/gnd/118514768/about) so 
*isoliert* ansehe, fehlen mir bislang sinnvolle Anwendungsfälle. Haben 
Sie aber noch andere (Meta)daten oder sogar Volltexte in der Hinterhand, 
dann stehen Sie mit Solr im wahrsten Sinne des Wortes auf der 
Sonnenseite. Ich würde Ihnen den DataImportHandler und insbesondere den 
XPathEntityProcessor ans Herz legen -- dann brauchen Sie nach der 
Schemadefinition eigentlich nur noch einige geeignete XPath-Ausdrücke 
definieren, um die Daten in den Lucene-Index zu pumpen.

In jedem Fall bin ich sehr gespannt und würde mich freuen, wenn Sie das 
Ergebnis Ihrer Bemühungen öffentlich zugänglich machen könnten und damit 
weitere Diskussionen über dieses wichtige und aktuelle Thema auslösen. 
Generell sehe ich aber die Herausforderungen weniger auf technischer 
Seite, sondern eher in der sinnvollen Verwendung der Daten im Sinne 
eines gesteigerten Nutzungserlebnis. Das sollten wir immer im Blick 
behalten, denn sonst bleiben alle Bemühungen reiner Selbstzweck.

Beste Grüße,
Sascha Szott

Am 28.05.2010 13:34, schrieb Uwe Reh:
Liebe Liste,

ich habe nur eine Idee und kein tolles fertiges Projekt.
Da die Idee nicht extravagant ist, arbeitet wahrscheinlich schon
irgendwer an einer ähnlichen Idee.

Meine Idee ist es, die von der DNB als Linked Data bereitgestellte GND
prototypisch mit Solr zu indexieren. Prinzipiell ist das kein Problem es
ist 'nur' mal wieder viel Detailarbeit.

Ich möchte mir ersparen, das Rad zum x-ten mal zu erfinden. Darum die
Frage: "Arbeitet jemand gerade an einem vergleichbaren Projekt?"

Viele Grüße
Uwe Reh


-- 
Sascha Szott
Kooperativer Bibliotheksverbund Berlin-Brandenburg (KOBV)
c/o Konrad-Zuse-Zentrum fuer Informationstechnik Berlin (ZIB)
Takustr. 7, D-14195 Berlin
Zimmer 4357
Telefon: (030) 841 85 - 457
Telefax: (030) 841 85 - 269
E-Mail: szott@xxxxxx
WWW: http://www.kobv.de

-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.