[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

http://metager.de/index-hss



Liebe Liste,

wir haben unsere Crawler im Umfeld von MetaGer und Forschungsportal mal
wieder auf die Reise geschickt, um die Inhalte der
Hochschulschriftenserver zu erfassen. Das ist bei 44 Servern auch gut
gelungen, es blieb ein Rest von 19 Server, die aus drei Gruenden 
(bisher) nicht von uns erfasst werden konnten:

  1) Zugriff verboten,
  2) Inhalt der an sich fuer Crawler vorgesehenen Indexliste leer,
  3) keine crawlbare Indexliste vorhanden.

1) und 2) sind sicherlich Fehlkonfigurationen, 3) mag auch daran
gelegen haben, dass wir (trotz haendischem Suchen) keine crawlbare
Indexliste gefunden haben.

Wir koennten die 19 Server natuerlich dadurch erfassen, indem wir
versuchen, sie KOMPLETT zu indexieren: das wollen wir aber nicht, denn
dann kaeme auch etliches dazu, was nicht zu den Hochschulschriften
zaehlt (wie Mensa-Oeffungszeiten usw.). Wir wollen hiermit ja gerade
eine moeglichst "muellfreie" Suche anbieten. Konventionelle Crawler
machen es sich da einfacher, indem einfach ALLES erfasst wird. Trotzdem
finden wir mit unserer gezielten Suche, MEHR (und hochwertigeres) als
die normalen Suchmaschinen (bei Bedarf kann ich dazu gern Beispiele
nennen).

Vielleicht liest ja jmd. der Serverbetreiber aus der Gruppe dieser 19
bisher nicht crawlbaren hier in der Mailingliste mit, oder jmd. kann
einen Hinweis geben? Es sind folgenden Server, an denen sich unser
Crawler bisher "die Zaehne ausbeisst":

http://www.opus-bayern.de/uni-bamberg/volltexte/opus-index/opus-indexliste.html
http://archiv.ub.uni-heidelberg.de/volltextserver/abfrage_suchen.php
http://www.ub.uni-duisburg-essen.de/recherch/eltexte/veroeff.shtml
http://hsss.slub.dresden.de/
http://archiv.ub.uni-marburg.de/opus/volltexte/opus-index/opus-indexliste.html
http://kirke.ub.uni-lueneburg.de/
http://kluedo.ub.uni-kl.de/volltexte/opus-index/opus-indexliste.html
http://kluedo.ub.uni-kl.de/
http://opus-ho.uni-stuttgart.de/
http://dol.uni-leipzig.de/
http://vts.uni-ulm.de/
http://digbib.iuk.hdm-stuttgart.de/
http://www.ubka.uni-karlsruhe.de/
http://www.bibliothek.tu-ilmenau.de/elektr_medien/dissertationen/
http://e-diss.uni-kiel.de/
http://edocs.tu-berlin.de/diss/
http://edoc.hu-berlin.de/
http://edocs.fu-berlin.de/
http://www.diss.fu-berlin.de/liste.html


Das separaten Interface zu unserer HSS-Suchen (nur html) finden Sie wie
immer unter:

   http://metager.de/index-hss

Ausserdem werden diese Ergebniss in MetaGer eingespeist, und dort mit
hohem Ranking versehen. Ich wuerde mich freuen, wenn es gelingt, noch
weitere der o.g. Server zu erfassen! Eine weitere Schnittstelle (die
auch PDF erfasst, wenn auch nicht komplett) bietet unser neues
ForschungsPortal:

   http://ForschungsPortal.Net

Und zum Schluss doch noch ein Schlusswort:

Es kann doch wohl nicht angehen, dass alles Sinnen und Trachten selbst
des Bibliothekswesens nur noch darin besteht, im Index einer
californischen Inc. aufzutauchen!!

Mit den besten Gruessen,
Wolfgang Sander-Beuermann
--
Dr. Wolfgang Sander-Beuermann      0511-762-4383         wsb@xxxxxx
Projektleiter Suchmaschinenlabor   http://metager.de/
Geschaeftsfuehrer SuMa-eV          http://suma-ev.de/    wsb@xxxxxxxxxx


Listeninformationen unter http://www.inetbib.de.