[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] BASE. Scirus. ...



Klaus Graf schrieb:

Hallo!

Ich hatte ja detailliert dargestellt, dass Google bei den
PDFs der Schriftenserver gravierende Luecken hat,

Google für Literaturrecherche ist "problematisch" (at best).

Die an anderer Stelle von anderen aufgeführte
Literaturrecherchestrategie halte ich für einen
"interessanten" Ansatz. Würde mich mal interessieren ob da
schon jemals ein vernünftiges Ergebnis bei heraus kam.
(Eigrenzung der Sprache auf "deutsch"???)

andere Suchmaschinen noch weniger PDFs von Freidok haben.
SCIRUS hat kein einziges meiner Freidok-PDFs.

Das an einem Autor festzumachen ist IMHO nicht repräsentativ.

SCIRUS hat aber auch einen ganz anderen Schwerpunkt. Man
vergleicht bei SCIRUS vs. BASE vs. Google IMHO Äpfel mit
Birnen und Bananen. Schwierig... Garantiere ich ihnen, die
beste Datenbank die's gibt (für meine Branche) wird keine
einzige ihrer Zeilen nachweisen. Egal was sie machen und
wenn sie sich auf den Kopf stellen, SPIRES nimmt nur HEP.
Und das ist GUT so. Drum findet man da dann halt auch
einfach in der HEP was man sucht. Schnell und zuverlässig.

Man sollte vielleicht doch einfach die angemessene Datenbank
benutzen und nicht nach geisteswissenschaftlichen Texten in
einer Datenbank mit extrem naturwissenschaftlichem
Schwerpunkt suchen. Das ist nicht sehr sinnvoll. Und da ist
dann auch nicht die Datenbank schlecht, der Fehler liegt da
eher auf Layer 8.

Ausgangspunkt meiner Recherchen war ein Beitrag von Peter
Murray-Rust, der sich mit chemischem Datamining befasst
und die Besprechung bestimmter Substanzen in Volltexten
maschinell auswerten moechte.

Womit wir dann aber relativ weit von einer "Freitextsuche"
im Vollgtext weg sind und letztlich bei einer maschinellen
Verschlagwortung auf Basis des Volltexts landen, so dass der
Text an sich wiederum in Kategorien eingruppiert wird, die
gröber sind als ein Einzelwort in einem Volltext. Und das
ist ein IMHO wesentlicher Unterschied.

Und: das tun die Kollegen in Bielefeld meines Wissens nicht.
Also ist es nicht ganz korrekt ihnen vorzuwerfen es würde
etwas nicht funktionieren was sie nicht machen.

Es kann ueberhaupt keine Frage sein, dass nur
Volltextsuchen wissenschaftliche Inhalte angemessen
erschliessen koennen.

Für eine Volltextsuche bezweifle ich das sehr wohl. Die ist
nur begrenzt sinnvoll. Haben ihre einfachen Recherchen ja
auch ergeben, dass da nichts gescheites herauskommt:

"Bei bestimmten Suchbegriffen müllen [...] Volltextquellen
[...] die Trefferlisten zu."

In den Naturwissenschaften würde ich vermuten kommt man
damit noch weiter als in den Textwissenschaften (da kenne
ich mich nicht aus). Da gibts wengistens einen guten Satz
hinreichend scharfer Begriffe. Titel sind deutlich näher am
fachlichen Inhalt usw. Aber schön ist's da auch nicht:
Sachliche Recherchen in WoS vs.  Inspec z.B., das sind zwei
Welten. Die Schöne ist Inspec, da gibts einen Thesaurus und
eine Systematik. Das Mapping von Inspec->WoS ist nicht ganz
trivial. (Außer man nimmt die Inspec-Trefferliste.)

Das ist ja das Problem, das Google heute hat. Nichts
schlimmeres als Webforen und der ganze Kram. Schlagartig
meint jeder irgendwas schreiben zu müssen. Da kann man
richtig schöne Suchbegriffe haben, aber wenn die Menge Text,
die indexiert wird mal groß genug ist findet man nicht mal
mit technischen Typenbezeichungen und ganz spezifischen
Fragen zu technischen Details mehr etwas. Jedenfalls finde
ich mittlerweile oft nur noch meine Fragen von anderen
Leuten und sinnfreie Antworten von Leuten, die die nämliche
nicht verstanden haben aber auch mal was sagen wollten. Ist
halt Volltextindex.

Eine Verschlagwortung kann das nie und nimmer leisten.

Obiges gibts bei einer Verschlagwortung/Systematisierung
eben nicht.

Bis jetzt ist noch nicht gesagt ob ich da als Fachreferent
intellektuell mit dem Werk vor mir erschließe oder ob ich
das eine Maschine machen lasse. Das ist noch mal eine ganz
andere Frage welche letztlich dadruch entschieden wird, ob
die Maschine das irgendwann mal kann.

Da gebe ich heute zu bedenken: die Kollegen aus der IT die
das machen reden immer von hochstrukturierten Dokumenten die
sie da als Input wollen. XML und solche Sachen, denen ist ja
oft LaTeX nicht schön genug. Nein, nein, ein paar <> in einem
ASCII-Text verteilen tut da nicht. Sind wir also immer noch
sehr weit weg von einer maschinellen Verschlagwortung eines
Freitexts. Heute. Vielleicht ist in einigen Jahren AI mal
schlau genug. <zweifel> (bezüglich der Zeitskala; nur
bezüglich der Zeitskala).

--

Kind regards,

Alexander Wagner
Subject Specialist
Central Library
52425 Juelich

mail : a.wagner@xxxxxxxxxxxxx
phone: +49 2461 61-1586
Fax  : +49 2461 61-6103
http://www.fz-juelich.de/zb/mitarbeiter/fachinformation#wagner


------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------
Forschungszentrum Juelich GmbH
52425 Juelich
Sitz der Gesellschaft: Juelich
Eingetragen im Handelsregister des Amtsgerichts Dueren Nr. HR B 3498
Vorsitzende des Aufsichtsrats: MinDir'in Baerbel Brumme-Bothe
Geschaeftsfuehrung: Prof. Dr. Achim Bachem (Vorsitzender),
Dr. Ulrich Krafft (stellv. Vorsitzender), Prof. Dr. Harald Bolt,
Prof. Dr. Sebastian M. Schmidt
------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------

-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.