[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Wikipedia IST höchst problematisch - Fallbeispiele



On Dec 8, 2007 11:33 PM, Dirk Lewandowski
<dirk.lewandowski@xxxxxxxxxxxxxxxxxx> wrote:
Lieber Herr Weber,

ich werfe Ihnen natürlich nicht vor, dass Sie Google zum
Recherchieren verwenden, das sollte nur eine witzig gemeinte
Nebenbemerkung sein...

Ich sehe es aber schon als problematisch an, daß Sie sich die
*Behauptung* (und mehr ist es ja nicht!) von Frau Lorenz zu eigen
machen, ohne dass es für diese irgendeinen Beleg gibt.
Dass Sie sich die Behauptung zu eigen machen, lese ich zumindest aus
Ihrem Text, der ja nicht hinterfragt, ob diese Behauptung denn nun
stimmt oder nicht. ("The same scientist also speculated" bezieht sich
ja auf den nächsten Abschnitt und nicht auf die angebliche
Kooperation selbst.)


Ich hatte damals mit Lorenz einen Email-Wechsel, der leider etwas
unfreundlich endete. Ich hatte mich damals weniger um den wertenden
Teil ihres Textes gekümmert als um kleinere und größere Fehler auf der
faktischen Seite. Man kann jetzt den Unterschied zwischen "in million"
und "per million" auf der Y-Achse für Nitpicking halten und eine
Geschichtswissenschaftlerin ist wohl auch nicht verpflichtet, ihn zu
kennen, die schroffe Reaktion fand ich damals aber eher ungewöhnlich.

Zu http://meta.wikimedia.org/wiki/Wikimedia_partners_and_hosts kann
man sagen, daß dies "nur ein weiteres Wiki" ist, in dem Metaaspekte
der Wikimedia Foundation diskutiert und dargestellt werden. Texte dort
sind eher unverbindlich (und viel zu oft veraltet). Der zitierte Text
wurde von Benutzer SJ eingefügt (könnte auch ein Cut&Paste von
woanders gewesen sein:
http://meta.wikimedia.org/w/index.php?title=Wikimedia_partners_and_hosts&diff=prev&oldid=98472).

Selbst SJ beschreibt ja erstmal nur einen zeitlichen Zusammenhang und
spekuliert ein wenig herum. Eine in meinen deutlich plausiblere
Variante ist, daß vor dem Feed Yahoo nicht in der Lage war, sinnvoll
und zeitnah die Seiten auf Wikipedia.org zu crawlen. Vor dem Einsatz
der (ehemals Google) Sitemaps (kann und sollte m.E. jeder einsetzen:
http://sitemaps.org/) hatten wir bei den meisten Suchmaschinen eher
Wochen denn Tage, bis Änderungen in Inhalten (oder gar neue Artikel)
in deren Index auftauchten. Ich hatte das damals eher anekdotenhaft
beispielsweise bei [[de:Sarah Kane]] angeschaut, die relativ prominent
verlinkt war. Das andere Feature nannte sich bei Yahoo "InfoExpress",
also das Äquivalent zur Google OneBox, die über den "organischen"
Suchtreffern angezeigt wird. Yahoo hat hier vor allem Snippets bei
Länderanfragen generiert. Das ist offenbar heute nicht mehr der Fall
(http://help.yahoo.com/l/de/yahoo/search/express/express-01.html).

Bringt es etwas, wenn ich in einfachen ganzen Sätzen nochmal feststelle:

* Es gibt derzeit keine Kooperation zwischen Wiki{p|m}edia und Google.
* Davon ausgenommen sind beispielsweise Kommunikation über Bugs
(ehemals kein Crawling von Seiten nach der Struktur
"de.wikipedia.org/wiki/Image:Foo.jpg)
* Wikimedia bietet Sitemaps-Dateien an.
* Einzelne Wikipedianer spielen mit Google Co-op herum.
* Wikimedia hat weder Googlepedia programmiert noch in Auftrag gegeben.
* Die Kooperation zwischen Yahoo und Wikimedia umfasst das
Bereitstellen von etwa 20 Servern in Asien und die Lieferung eines
Datenfeeds mit Wikipedia-Inhalten.

Für Aktualisierungen, Hinweise, Klarstellungen etc. bin ich dankbar.

Mathias



Listeninformationen unter http://www.inetbib.de.