[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Google's Tragik - EASE - European Academic Search Engine



Die UB Bielefeld hat kürzlich in Kooperation mit der norwegischen
Firma Fast Search & Transfer, der Fa. Exorbyte aus Konstanz sowie
13 weiteren Institutionen (Forschern und Forschergruppen aus
Muenchen, Hannover, Padua und Oxford, Bibliotheken und
Bibliotheksverbundzentren) einen Antrag im Rahmenprogramm 6
(FP6) der EU gestellt. FAST ist zumindest in Europa fuehrend in der
Entwicklung von Suchmaschinentechnologie und steht z.B. hinter
AllTheWeb und SCIRUS.

"EASE - European Academic Search Engine" hat ein konkretes
Konzept erarbeitet, um wissenschaftlich relevante Online Information
in unterschiedlichsten Formaten zukuenftig mit intelligenter (next
generation) industrieller Web Suchmaschinentechnologie zu
indexieren und in einem verteilten europäischen Master-Index
zusammenzuführen. Eine Vielzahl unterschiedlicher Sichten, d.h.
Search & Retrieval-Interfaces, ermöglicht dann den Zugriff auf diesen
Index. Attraktiv an diesem Konzept ist, dass diese unterschiedlich
konfigurierten Such-Interfaces in die jeweils vorhandenen
Informationsumgebungen einer Bibliothek oder einer virtuellen
Fachbibliothek ohne zusaetzliche Hard-/Software integriert werden
koennen. Die neue Technologie kann dadurch in vorhandene Digitale
Bibliotheken, Portale etc. eingebaut werden.

Die UB Bielefeld konnte bei der Koordinierung dieses Integrierten
Projekts (IPs) die Erfahrung aus fast einem Jahr Test- und
Evaluationsarbeit mit FAST einbringen - und natuerlich die
Erkenntnisse aus der Entwicklung der Digitalen Bibliothek NRW. Wir
sind zuversichtlich, dass wir mit dem Einsatz intelligenter und
leistungsfähiger Suchmaschinentechnologie erfolgreich eine neue
technische Retrievalplattform bereitstellen koennen fuer die
wissenschaftliche Informationsversorgung, nicht nur in Deutschland.
Die UB Bielefeld arbeitet in diesem Bereich in Deutschland - ueber
den besagten EU-Antrag hinaus - u.a. auch mit dem HBZ und dem
KOBV zusammen, die als Verbundzentralen nach der
Entwicklungsphase fuer den Betrieb eines Regelservice vorgesehen
sind. Auch in Deutschland laufen konkrete Projektplanungen in
diesem Bereich, insbesondere im Kontext des Projektplans "Verteilter
Zeitschriften/Content Server", der vom KOBV (Herrn Luegger)
koordiniert wird und in dessen Rahmen die UB Bielefeld den Bereich
der Suchmaschinentechnologie uebernommen hat.

Hier einige Saetze aus dem europaeischen EASE-Antrag, ueber
deren uebliche EU-Prosa-Einbettung getrost hinweggesehen werden
darf:

(...) "Problem statement
______________________

 Scientific and cultural information is a key area in the Information
Society. Developments of Digital Libraries have up to now addressed
a number of issues related to aggregation of and access to resources
that are of essential value for research and progress in many areas of
human knowledge. However, these activities have usually looked at
specific aspects or specific sectors and the resulting landscape is
fragmented, making it difficult for a user to find resources in different
sectors and perceive the Information Society as a consistent whole.
On the other hand, developments of general-purpose search engines
have progressed in disclosing a wide variety of resources, both
professional and informal, for a wide audience. In that environment, it
is becoming increasingly difficult to distinguish high-quality,
professional resources from unmanaged and ephemeral resources.
Even specialised search engines are far from covering a significant
proportion of the 'Academic Web'. Moreover, existing specialized
search engines cover mainly English language resources.

Overall objective
________________

 EASE intends to build a future-safe, federated infrastructure for any
type of qualified and academically relevant information resource
based on advanced Research & Development in information retrieval.
It will create next generation Information Retrieval technology building
on both traditional Digital Library Information Retrieval and generic
Web search technology. It will, in particular, meet the specific
requirements of aggregating, searching, and presenting high-quality
online information resources. At the end of the EASE Project, the
operational information service resulting from the project will go far
beyond functionalities of current digital library portals and academic
information gateways. It will enable large-scale aggregation and
processing of structured and unstructured data from heterogeneous
data sources like text documents, bibliographic catalogues,
multimedia resources, binary data and primary research data for
analysis, search and matching to serve the needs of the entire
scientific community in Europe. A new generation indexing
infrastructure for Web searching will be in place that has moved from
today's monolithic architecture (e.g. Google, AllTheWeb) to a
federated system, where European regional and national data and
library centres will jointly create the European EASE Master Index.
This Index will offer an integrated view on all the scientific and cultural
information that constitutes the European Research Area. The
resulting EASE infrastructure can be integrated, through specific
views, in existing digital library portals and academic information
gateways, bringing added value to work that has been funded by
European and national programmes.

Specific Scientific and technological objectives
_____________________________________

The EASE Project has made the strategic decision to develop its
infrastructure on top of 'state-of-the-art' search and content matching
technology. This technology will provide EASE with the necessary
scalability, flexibility, and robustness to achieve a future-oriented
landmark for digital library services. The combination of leading-edge
research and a commercially available 'state-of-the-art' architecture is
the foundation that will enable EASE to achieve what is often lacking
in projects: innovation and sustainability at the same time."

Mit freundlichem Gruss
Norbert Lossau


Am 7 May 2003 um 16:25 hat Bernhard Eversberg geschrieben:

>
>
> Was C. Heinisch beschreibt:
> > ... was mittlerweile so viele Anbieter von Produkten
> > aller Art mit Google machen: Doorway-Pages in die Indexe
> > einschleusen, und über diese Doorway-Pages auf Produkte, Content
> > etc. verweisen, der sonst invisible ist.
>
> ist ein Aspekt der "Tragik der Allmende", die in den
> Wirtschaftswissenschaften gern diskutiert wird: Eine gemeinschaftlich
> genutzte und scheinbar kostenlose Ressource (als solche ist hier
> Google anzusehen) wird bedenkenlos ueberstrapaziert. Auf Dauer hat
> sowas noch nie funktioniert. Beim Cyberspace und bei Google sticht die
> Problematik nicht ganz so ins Auge wie bei der Gemeinschaftsweide, auf
> die jeder seine Kuehe treibt. Vielleicht, so offenbar die insgeheime,
> unausgesprochene oder gar unreflektierte Hoffnung, ist es ja in diesem
> Bereich doch anders. Vielleicht loesen Google & Co. die Quadratur des
> Kreises - man darf gespannt bleiben. Die Neigung zum Wunschdenken und
> zum Aberglauben ist bekanntlich ungebrochen. Wir jedenfalls haben aus
> den naemlichen Gruenden auf den Einsatz der bewussten Methodik
> verzichtet, obwohl wir sie anscheinend als erste entwickelt und am
> 1.4.2000 bekanntgemacht hatten (damals noch mit Hinweis auf Altavista
> als fuehrende Suchmaschine).
>
> "ein großes Stück des unsichtbaren Webs sichtbar" zu machen, das
> koennte auch mit anderen Mitteln gelingen. Es wurde auch schon vor
> Jahren ueber eine Wissenschafts-Suchmaschine diskutiert, welche dann
> OPAC-Inhalte (also z.B. die 12 Mio. Dateien beim HBZ) und andere
> Materialien, bis hin zu anderen Datenbankinhalten und
> Zeitschriftenaufsaetzen, auf neue Weise indexieren sollte. Allerdings
> waere so etwas nicht kostenlos und ohne viel Arbeit zu haben. Und so
> wird man wohl erst einmal weiter die Wollmilchsau fuettern, voll der
> Zuversicht, dass ihr auch noch Kiemen wachsen, damit sie nicht
> ertrinkt.
>
> N.B.
> Die genannte "Tragik" wurde unter dem Titel "The Tragedy of the
> Commons" 1968 in einem Science-Artikel von Garrett Hardin beschrieben.
>  Ueber Google (!) z.B. zu finden unter
>
> http://www.constitution.org/cmt/tragcomm.htm
>
> Darin steht die ernuechternde Erkenntnis: "Freedom in a commons brings
> ruin to all. Some would say that this is a platitude. Would that it
> were! In a sense, it was learned thousands of years ago, but natural
> selection favors the forces of psychological denial. The individual
> benefits as an individual from his ability to deny the truth even
> though society as a whole, of which he is a part, suffers." Und
> deshalb wird auch dieser Beitrag, wie der von Harding, nichts
> bewirken.
>
> Weil das so ist, sei sogar noch ein Tip spendiert:
> Google bekundet, dass man "Doorway pages" von der Indexierung
> ausschliesse, weil man Seiten mit Inhalten vorziehe. Wie man die
> ausfiltert, wird nicht verraten. Die 200.000 (keine 2%) vom HBZ
> haben's irgendwie geschafft, da durchzukommen. Herr Seiffert wird also
> rauszufinden haben, WIE sie das geschafft haben, um dann die anderen
> Seiten entsprechend zu maskieren. Vielleicht genuegts, an jede Seite
> irgendeinen zufallsmaessig generierten Text anzuhaengen, damit sie
> formal mehr Inhalt hat. Farbe weiss auf weiss, dann merkt's der
> normale Nutzer nicht.
>
>
>
> Bernhard Eversberg
> Universitaetsbibliothek, Postf. 3329,
> D-38023 Braunschweig, Germany
> Tel.  +49 531 391-5026 , -5011 , FAX  -5836
> e-mail  B.Eversberg _at__ tu-bs.de


****************************************
Dr. Norbert Lossau
Universitaetsbibliothek Bielefeld
Direktor
Tel.: 0521 106-4050
Fax.: 0521 106-4052
e-Mail: lossau _at__ ub.uni-bielefeld.de
www.ub.uni-bielefeld.de
****************************************



Listeninformationen unter http://www.inetbib.de.