Die "Wayback Machine" hat große Probleme: Immer mehr Anbieter blocken Inhalte


Die Wayback Machine hat seit über 30 Jahren das Ziel, möglichst viel von dem zu archivieren, was an Inhalten im Internet erscheint. Es handelt sich um eine Nonprofit-Organisation mit Sitz in San Francisco, die es inzwischen auf einen Datenschatz von mehr als einer Billion Webseiten (bzw. Webseite-Zuständen am jeweiligen Datum) bei einem Speicherbedarf von 99 Petabyte bringt. Begonnen hatte der Dienst bereits 1995, erst seit 2001 handelt es sich aber um ein öffentlich einsehbares Angebot. Unentwegt durchstöbern die Crawler größere und kleinere Webseiten, um Snapshots davon zu speichern.
Die größten Medienhäuser blocken den Zugriff inzwischenAllerdings steht die Zielsetzung der
Wayback Machine immer mehr vor Problemen. Wie Wired in einem Artikel
ausführt, gibt es immer mehr Anbieter, die den Zugang sperren. Während Content hinter einer Bezahlschranke ohnehin nicht offensteht, haben 23 reichweitenstarke Newsseiten die Crawler sogar komplett geblockt. Nicht immer geschieht das aber als direkte Maßnahme gegen den Archivdienst. USA Today erläutert in einer Stellungnahme beispielsweise, generell jede Art von Scraping-Bots an ihrer Arbeit zu hindern – es gehe definitiv nicht gezielt gegen die Wayback Machine.
Petition: Wayback Machine soll als Kulturgut anerkannt werdenIn einer gemeinsamen Petition von mehr als 100 Journalisten wird momentan die Forderung erhoben, den Dienst als wertvolles sowie wichtiges Werkzeug zu respektieren und dem Crawler Zugriff zu gewähren. Für Recherchezwecke sei die Wayback Machine oft unverzichtbar, denn es ließen sich Informationen nachschlagen, die ansonsten in der Versenkung verschwunden wären. Sei es, weil Betreiber Inhalte löschen, sei es, weil ein Portal den Dienst eingestellt hat – viele Originalquellen verschwinden sonst einfach im Laufe der Zeit.
USA Today blockt – und belegt die Wichtigkeit des DienstesEin Beispiel: Kürzlich hatte USA Today einen Artikel veröffentlicht, in dem die Methoden der US-Einwanderungsbehörde ICE analysiert und in den historischen Kontext gestellt wurden. So ließ sich anhand konkreter Daten belegen, wie stark sich der Kurs unter Trump wandelte. Genau das zeigt die schwierige Lage: Einerseits bezog man sich auf Fakten, die es ohne die Wayback Machine so nicht mehr gegeben hätte, andererseits hindert man das Angebot daran, die Artikel anschließend zu archivieren. Dies müsse anders gelöst werden, so die Forderungen.