Wayback Machine

Der Ausdruck Wayback Machine bezieht sich auf ein digitales Online-Archiv der Non-Profit Organisation Internet Archive. Seit 1996 werden dort die verschiedenen Inhalte von Webseiten archiviert und gespeichert. Diese gemeinnützige Organisation wurde vom amerikanischen Informatiker Brewster Kahle gegründet. Brewster Kahle ist ebenfalls Mitbegründer vom Online-Dienst Alexa. Im Jahr 2007 ist das Archiv im US-Bundesstaat Kalifornien offiziell als digitale Bibliothek anerkannt worden. Die Wayback Machine lässt sich unter der URL https://archive.org/ aufrufen.

Allgemeines zur Wayback Machine

In den Anfängen des Internet-Dienstes wurden die Daten für Wissenschaftler und Historiker gesammelt und ausschließlich offline gesichert. Erst 2001 stellte Internet Archive der Öffentlichkeit den Datenbestand über ein Online-Portal zur Verfügung. Die Speicherung der Versionen verschiedenster Web-Inhalte, inklusive Video- und Bilddateien, erfolgt in festgelegten Abständen. Mithilfe von Software-Programmen, sogenannten Crawler, erfolgt eine Durchsuchung der Webseiteninhalte aus dem Internet, bei der die jeweils aktuelle Version einer Webseite gespeichert wird. Dabei werden alle URLs mit einbezogen, die beim Online-Dienst Alexa hinterlegt sind.

Besucht der Crawler eine Seite erneut, so ersetzt die aktuelle Version nicht die alte, sondern wird zusätzlich in den Bestand der Wayback Machine von Internet Archive aufgenommen. Dies ermöglicht das Sichten von Webseiten-Versionen aus verschiedenen Zeiträumen. Dies bedeutet auch, dass im Archiv Seiten enthalten sind, die aktuell nicht mehr existieren.

Wenn ein Webseiten-Betreiber die Archivierung seiner Seite nicht möchte oder sogar die Entfernung aus dem Archiv der Wayback Machine wünscht, kann er dies durch die Anpassung der Datei robots.txt vornehmen. Dazu muss er Folgendes in die robots.txt-Datei einfügen:

User-agent: ia_archiver
Disallow: /

Internet Archive hat es sich zum Ziel gesetzt, Historikern, Lehrenden und der allgemeinen Öffentlichkeit mit der Wayback Machine Forschern einen möglichst barrierefreien und kostenlosen Zugang zu Webseiten, Büchern, Filme, Musik und Software zu bieten. Des Weiteren sorgt Internet Archive mit der Speicherung von Webseiten für eine Langzeit-Archivierung von Inhalten. Die seit 1996 gesammelten Daten haben inzwischen eine Größe von 20 Petabyte erreicht, die u.a. durch die Zusammenarbeit mit mehr als 400 Bibliotheken und Universitäten zustande gekommen ist. Jeder, der über einen (kostenlosen) Account verfügt, kann media-Inhalte ins Archiv von Internet Archive hochladen.

Startseite der Wayback Machine
Startseite der Wayback Machine (Quelle: https://archive.org/)

Funktionsweise der Wayback Machine

Das Abrufen von älteren Versionen einer Website aus dem Archiv gestaltet sich mit der Wayback Machine relativ unkompliziert. Der Nutzer muss dazu lediglich auf der Homepage im dafür vorgesehenen Suchfeld eine URL oder ein Keyword eingeben. Schon kann er die in diesem digitalen Web-Archiv enthaltene Historie durchsuchen. Der Nutzer kann bei seiner Suchanfrage per Erweiterte Suche-Funktion (Advanced Search) einen bestimmten Zeitraum angeben. Tut er dies nicht, werden alle Suchergebnisse angezeigt, die sich zu diesem Zeitpunkt im Bestand befinden. Die Online-Bibliothek kann aber noch weit mehr, als nur statische Suchergebnisse anzuzeigen. Möchte der Nutzer die jeweils angefragte Website besuchen, kann er diese mithilfe der Wayback Machine aufrufen. Dies ist insofern möglich, als die Online-Bibliothek neue Linkverbindungen zu den Daten herstellen kann, die im Archiv gespeichert sind. Obwohl es sich dabei um “veraltete” Web-Versionen handelt, können die Webseiten im Browser so genutzt werden, als wären es die aktuell existierenden Seiten.

Bedeutung der Wayback Machine im Online-Marketing

Die Nutzung der Wayback Machine kann für den Online-Marketing-Bereich von großer Bedeutung sein. Wenn eine Webseite in den Google SERPs abstürzt, kann sie dazu beitragen, den Grund dafür herauszufinden. Sie besitzt dementsprechend folgende Funktionen:

  • Suche nach kopierten Inhalten
  • Vergleich zwischen unterschiedlichen Versionen von Webseiten
  • Identifizierung und Entfernung von “toten Links”
  • Suche nach älteren Links
  • Suche nach verloren gegangenen Links
  • Ältere Links an neue URLs anzupassen

Im Bereich Suchmaschinenoptimierung sind die genannten Funktionen vom Online-Service daher von besonders großem Vorteil für Unternehmen, deren Website einen Absturz im Google-Ranking widerfahren ist. Der Vergleich verschiedener Versionen von Webseiten anhand ihrer Codes ermöglicht eine Analyse von eventuellen Schwachstellen, die aktuelle Version betreffend. So kann die Identifikation und direkte Entfernung von funktionsunfähigen Links zu einer Verbesserung in den Suchergebnissen bei Google sorgen. Funktionsunfähige Links, die auf leere Seiten verweisen und von Google erkannt werden, sorgen dafür, dass die Suchmaschine die jeweilige Website in den SERPs nach hinten verschiebt. Daher ist es von großer Bedeutung, derartige Links zu entfernen.

Die Funktion, verloren gegangene Links zu identifizieren, erweist sich ebenfalls als sehr nützlich für Unternehmen, die ihre Seite im Web suchmaschinenoptimiert gestalten möchten.
Die Suche nach älteren Links ist besonders hilfreich, wenn Unternehmen beispielsweise ihr Content-Management-System wechseln und dazu die Anpassung der URLs notwendig ist. Auch die Fähigkeit der Wayback Machine kopierte Inhalte ausfindig zu machen hat sich als vorteilhafte Funktion erwiesen. Da der Online-Service von Internet Archive ältere Versionen von Webseiten speichert, kann im Fall einer unberechtigten Kopie von Inhalten anhand dieser Funktion bewiesen werden, dass diese Inhalte bereits zuvor existierten. Wenn also ein Fall von Duplicate Content oder die Copyrights betreffend vorliegt, lässt sich anhand der Wayback Machine der tatsächliche Urheber eines Textes im Web nachweisen.

Alternativen zur Wayback Machine

Es gibt kaum Alternativen zur Wayback Machine, die hinsichtlich ihrer Leistungsfähigkeit mit der gigantischen Online-Bibliothek vergleichbar sind. Google bietet seinen Nutzern verschiedene Möglichkeiten, ältere Versionen von Webseiten aus dem Google-Cache anzeigen zu lassen.
Unter Eingabe der nachfolgenden URL kann man sich den Cache einer beliebigen Web-Adresse anzeigen lassen.

http://google.com/search?q=cache:www.deine-url.xyz

Eine weitere Möglichkeit den Cache einer bestimmten Seite aufzurufen, ist über die Suchfunktion von Google. Die durch die Suchanfrage ermittelten Suchergebnisse sind teilweise mit einem grünen Pfeil versehen (siehe unten angezeigtes Bild). Klickt der Nutzer auf diesen Pfeil, öffnet sich ein Fenster mit der Option Im Cache und ggf. Ähnliche Seiten. Auf diese Weise kann sich der Nutzer den Cache einer Web-Adresse anzeigen lassen.

Ablauf einer Suche im Google-Cache

  1. Im Google-Suchfeld eine beliebige URL/ein beliebiges Suchwort eingeben.
  2. Auf den grünen Pfeil klicken, der sich neben der URL befindet.
  3. Auf Im Cache klicken.
Wayback Machine: Beispiel für die Suche mit dem Google-Cache
Beispiel für die Suche mit dem Google-Cache

Der Nachteil am Google-Cache ist, dass dort nur Web-Inhalte für wenige Wochen gespeichert werden. Sobald Google den Cache erneuert, werden die zuvor archivierten Daten automatisch gelöscht. Ein weiterer Nachteil ist, dass dort lediglich einzelne Seiten gespeichert werden, anstelle von gesamten Webauftritten, wie es bei der Wayback Machine der Fall ist. Klickt der Nutzer auf einen Link der im Cache angezeigten Seite, wird ihm nicht die Seitenversion zum Zeitpunkt der letzten Speicherung angezeigt, sondern die aktuelle Version.

Kritik

Aufgrund ihrer Fähigkeit Web-Inhalte wie Webseiten zu speichern, bleibt auch die Wayback Machine von Kritik in Bezug auf Datenschutz und Urheberrechten nicht verschont. Demnach kann es vorkommen, dass das Archiv Daten von Webseiten enthält, die aus rechtlichen Gründen gelöscht werden mussten. Einmal archiviert sind die Inhalte jedoch dauerhaft über die Online-Bibliothek einsehbar. Weiter wird kritisiert, dass die Indexierung der Web-Inhalte unregelmäßig und teilweise nicht vollständig durchgeführt wird. Werden Multi-Media-Dateien nicht ins Archiv mitaufgenommen, ist es möglich, dass die jeweilige Seite nicht mehr aufgerufen werden kann.

Fazit

Die Wayback Machine stellt für Nutzer ein hilfreiches Tool dar, wenn es darum geht, erfahren zu wollen, wie eine beliebige Webadresse zu einem bestimmten Zeitpunkt in der Vergangenheit ausgesehen hat. Für den Bereich Online-Marketing bietet die besagte Online-Bibliothek von Internet Archive im Hinblick auf Suchmaschinenoptimierung nützliche Möglichkeiten wie die Identifizierung von verloren gegangenen  und nicht mehr funktionierenden Links. Grundsätzlich lässt sich sagen, dass die Wayback Machine für das Google Ranking von großer Bedeutung sein kann.

Quellen

Ihr Weg zu mehr Besuchern und Umsatz

Send this to a friend