[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] AW N: Archivierung von Webseiten zu Förderprojekten



Guten Tag miteinand,

 

eine Antwort eines Medieninformatikers, der Versuch zumindest.

 

Fall 1: Wir kopieren statische Zustände der Webseite herunter und archivieren 
diese auf einem anderen Server. (Internet Wayback Machine klassisch.) Die 
Navigation zwischen den Zuständen müsste händisch oder per Script nachgepflegt 
werden, da sich die URLs verändern.

 

Webseiten sollten konsequent in HTML5 und CSS, ggf. nur für die Navigation mit 
einzelnen JavaScript-Funktionen programmiert sein. 

 

Hintergrund ist, dass allein die Verwendung sogenannter Web Components (also 
Funktionsteile in der Optik, die in HTML5 nicht definiert sind) bereits 
abhängig von der Mitlieferung der Bibliothek an Web Components oder sogar von 
Teilen eines Frameworks (und das in Abhängigkeit von der Versionsnummer in 
gewisser kleiner Variation) sein kann, was die Lauffähigkeit der 
"abgegriffenen" Webseite angeht. (Im Sinne der Internet Wayback Machine.)

 

Es ist zu vermeiden, Single Page Applications oder gar Progressive Web Apps 
(PWAs) als Programmierform zu wählen, da diese auf dem Client ihre 
HTML-Darstellung im Zuge des Benutzungszustands verändern können. Dann weiß man 
nicht, welchen Zustand man gerade statisch herunterkopiert hat.

 

Videos, Audios und manchmal auch Bilder werden meist ob des Urheberrechts oder 
ob der schnellen Veränderung von Datenformaten, die Webbrowser akzeptieren, 
nicht mit gespeichert. Wichtige Aussagen müssen deshalb im Text stecken.

 

Das Angebot muss „self-contained“ sein, also nicht über mehrere URLs per 
Verlinkungen erst einen Sinn ergeben. 

 

Fall 2: Das bestehende Webangebot konservieren, in die Ewigkeit aufbewahren.

 

Dazu müsste man es am besten in einer Virtual Machine mit Webserver und 
Internetangebot installieren und davon Images aufbewahren. Diese Images könnte 
man dann auch als Virtual Machine unverändert auf anderen, späteren 
Betriebssystemen und Rechnerarchitekturen wieder aufspielen. Auch die Hardware 
darf veralten oder „aussteigen“. Kein Problem bis auf nachlassenden Virenschutz 
mangels verfügbarer Updates und Upgrades ab einem gewissen Verfallsdatum der 
bei der Erstellung genutzten Technologien.

 

In diesem Fall wäre alles erlaubt, was technologisch einsetzbar ist. Die 
Unsicherheit liegt nur in der Außerkraftsetzung gewissen JavaScript-Funktionen 
und in sich ändernden Video- und Audio-Formaten in der Zukunft in Webbrowsern. 

 

Ansonsten gilt: Das Web ist ein kurzlebiges Medium. Im Ernstfall hilft nur ein 
guter PDF-Erzeuger, der die Webseite jeweils statisch als PDF konservieren 
kann, wie sie aussah. 

 

Es wird durchaus auch andere Erfahrungen geben – Tipps und Tricks würde ich 
gern erfahren. 

 

Mit freundlichen Grüßen

Michael Frank.

HTWK Leipzig, Fak. Informatik und Medien.

--------------------------------------------------------------------------

 

 

 

-----Ursprüngliche Nachricht-----
Von: InetBib [mailto:inetbib-bounces@xxxxxxxxxx] Im Auftrag von Bargheer, Margo 
via InetBib
Gesendet: Mittwoch, 3. April 2019 09:27
An: Patrick Sahle; inetbib@xxxxxxxxxx
Betreff: Re: [InetBib] Antw: Re: Archivierung von Webseiten zu Förderprojekten

 

Liebe Liste,

da auch andere FIDs und Institutionen Langzeitverantwortung für digitale 
Portale tragen (mit den von Patrick skizzierten Herausforderungen) oder 
demnächst übernehmen sollten/müssten, wäre es interessant zu erfahren, ob es 
übergreifende Ansätze für die skalierbare Konservierungsstrategie gibt und in 
welcher Governance Struktur die stattfinden (sollten).

 

Gibt es bestimmt, aber da wir in unserem Team „Elektronisches Publizieren“ eher 
an der Erstellung solcher Portale beteiligt sind, würden wir gern 
sicherstellen, dass wir die Autoren/Redakteure/Projekte schon zu Beginn in die 
Richtung leiten, in der mittel- und langfristig die — zu definierende — 
Funktionalität und Erreichbarkeit der Portale gewährleistet ist.

 

Als Anregung: das Thema der 2019 Open Access Tage in Hannover lautet 
„Nachhaltigkeit“. Bis 15.04.2019<x-apple-data-detectors://0> können noch 
Vorschläge für Workshops und Vorträge eingereicht werden. Falls jemand aus 
diesem Themenkreis dort vortragen wird, ich werde garantiert in Ihrer 
Veranstaltung sitzen!

Viele Grüße

Margo Bargheer

 

 

https://open-access.net/community/open-access-tage/open-access-tage-2019/call-for-proposals-open-access-tage-2019/

 

 

sent from an UGOE-iPhone

 

Electronic Publishing

University Library Göttingen

Margo Bargheer

mbarghe@xxxxxxx<mailto:mbarghe@xxxxxxx>

+49 1515 288 1644

 

https://orcid.org/0000-0001-8246-8210

 

Am 28.03.2019 um 10:05 schrieb Patrick Sahle via InetBib 
<inetbib@xxxxxxxxxx<mailto:inetbib@xxxxxxxxxx>>:

 

 

Liebe Liste,

 

ok, ich sehe, wir brauchen ein Mindestmaß an Differenzierung und 
Begriffsklärung. Wir reden hier wohl von zwei grundlegend unterschiedlichen 
Ansätzen.

 

1) Archivierung im engeren Sinne: harvest/download/freeze - daran schließt sich 
die Frage der funktionalen Reduktion an

2) Archvierung im weiteren Sinne: Pflege und Vorhaltung von Webanwendungen - 
daran schließt sich (verkürzt) die Frage nach Aufwand und Kosten an

 

Diesen Unterschied sollte man nicht vergessen. (1) betrifft ja nur temporäre 
Snapshots "statischer" Inhalte unter Verlust aller dynamischen Funktionen und 
umfasst nicht die Sicherung und dauerhafte Bereitstellung von Webseiten in 
ihrem originalen "setting". Liebe Frau Herr, bitte korrigieren Sie mich, wenn 
ich die genannten Dienste hier missverstehe.

 

Viele Grüße, Patrick Sahle

 

Am 27.03.2019 um 12:15 schrieb Wiebke Herr via InetBib:

Liebe Kolleginnen und Kollegen,

 

speziell für fachlich relevante Webinhalte bieten die Fachinformationsdienste 
der Bayerischen Staatsbibliothek (Altertumswissenschaften, 
Geschichtswissenschaft, Musikwissenschaft, Ost-, Ostmittel- und Südosteuropa) 
eine Archivierung von Webseiten über ihren Wunschbuchservice an.

 

Entsprechende Wünsche können gemeldet werden unter:

 

 

https://www.bsb-muenchen.de/sammlungen/altertum/fachinformationsdienst/wunschbuch

 

 

https://beta.historicum.net/services/wunschbuch

 

 

https://www.bsb-muenchen.de/sammlungen/musik/fachinformationsdienst/wunschbuch

 

 

https://www.osmikon.de/services/wunschbuch

 

 

Sofern die Rechteinhaber zustimmen und technische Standards erfüllt sind, 
erfolgt sodann die Archivierung der Website. Diese kann einmalig sein oder in 
festzulegenden Abständen stattfinden.

 

 

Viele Grüße

Wiebke Herr

 

---

Dr. Wiebke Herr

Bayerische Staatsbibliothek

Abteilung Bestandsentwicklung und Erschließung 2

Zentrum für Elektronisches Publizieren / Fachinformation Geschichte

Stellvertretende Referatsleiterin

 

Ludwigstraße 16, 80539 München

Tel:+49-89-28 638-2846

E-Mail: Wiebke.Herr@xxxxxxxxxxxxxxx<mailto:Wiebke.Herr@xxxxxxxxxxxxxxx>

 

 

 

 

"Hartwig, Falk via InetBib" <inetbib@xxxxxxxxxx<mailto:inetbib@xxxxxxxxxx>> 
26.03.2019 09:21 >>>

Lieber Herr Meier,

 

die BSB hat ein Programm zur Archivierung von Webseiten.

https://www.babs-muenchen.de/index.html?c=workflows_web&l=de

 

 

Beste Grüße,

 

Falk Hartwig

Bibliotheksleitung | Head of Library

 

 

 

Hochschule für Musik Nürnberg | Nuremberg University of Music

Veilhofstr. 34 | 90489 Nürnberg

Tel. +49(0) 911 - 21522 180

www.hfm-nuernberg.de<http://www.hfm-nuernberg.de> | 
facebook.de/hfm-nuernberg<http://facebook.de/hfm-nuernberg>

 

-----Ursprüngliche Nachricht-----

Von: via InetBib [mailto:inetbib@xxxxxxxxxx]

Gesendet: Montag, 25. März 2019 18:28

An: inetbib@xxxxxxxxxx<mailto:inetbib@xxxxxxxxxx>

Betreff: [InetBib] Archivierung von Webseiten zu Förderprojekten

 

Liebe Kolleginnen und Kollegen,

 

seit einigen Jahren machen einige Forschungsförderer den Förderempfängern

zur Bedingung, dass das Forschungsprojekt eine eigene Website betreibt.

Diese Website belegt eine kostenpflichtige Domain, die auch nach

Projektende Kosten verursacht.

Ist das Projekt beendet, wird die Projektsite für einige Jahre weiter

betrieben. Das kostet Ressourcen, die der Betreiber nicht mehr aus

Projektmitteln bestreiten kann.

Deshalb wächst mit den Jahren die Bereitschaft, solche Projekt-Websites

abzuschalten.

 

Beispiel einer Projekt-Website: https://planarcal.ptb.de/

 

Meine Frage an Sie:

Kennen Sie Initiativen, die solche Projekt-Webseiten (Projektteilnehmer

kommen aus verschiedenen Ländern) zuverlässig archivieren

und über ihr Archiv zugänglich halten?

 

Ich kann mir gut vorstellen, dass die Kollegen aus der MPG und der

Helmholtz-Gemeinschaft einen Workflow haben,

die Seiten zu archivieren, die zu eigenen Projektbeteiligungen gehören.

 

Mir ist nicht klar, ob die DNB eine Aufgabe in der Archivierung von

solchen Projektseiten sieht.

 

Ich hoffe, einige von Ihnen können über die Liste Hinweise und Erfahrungen

weitergeben.

 

Besten Gruß

Joachim Meier

____________________________________________________

Dr.-Ing. Joachim E. Meier

Referatsleiter Q.11, Wissenschaftliche Bibliotheken

Physikalisch-Technische Bundesanstalt (PTB) (http://www.ptb.de)

PF 3345                 Tel. +49-531-592-8110

38023 Braunschweig    Fax. +49-531-592-8137

GERMANY                 E-mail: 
Joachim.Meier@xxxxxx<mailto:Joachim.Meier@xxxxxx>

____________________________________________________

 

 

 

 

--

Apl. Prof. Dr. Patrick Sahle

Universität zu Köln <http://www.uni-koeln.de> - Cologne Center for eHumanities 
(CCeH) <http://www.cceh.uni-koeln.de/>

Koordinierungsstelle Digital Humanities der Nordrhein-Westfälischen Akademie 
der Wissenschaften <http://cceh.uni-koeln.de/DH-AWK/>

Data Center for the Humanities <http://www.dch.uni-koeln.de/>

Institut für Dokumentologie und Editorik <http://www.i-d-e.de>

Büro: Meister Ekkehart Straße 11, 50923 Köln, Raum 2.07, Tel.: 0221-470-3894

@patrick_sahle <https://twitter.com/patrick_sahle> - @CCeHum 
<https://twitter.com/CCeHum> - @ideinfo <https://twitter.com/ideinfo>


Listeninformationen unter http://www.inetbib.de.