Das Internet Archiv – archive.org

Viele wissen es nicht, doch das Internet wird täglich mehrfach kopiert. Der größte Betreiber ist hierbei das Internet Archiv. Seit 1996 kopiert dieser Dienst jede Internetseite, die beim Alexa Dienst hinterlegt ist. Insgesamt soll der gemeinnützige Anbieter schon 400 Milliarden Seiten archiviert haben.  Das Gesamtvolumen betrug Ende 2012 zehn Petabyte und wächst um über 100 Terabyte pro Monat.

Ich glaube es ist für Viele unvorstellbar, ihre eigenen Webseiten könnte noch Jahrzehnte später im Web aufzufinden sein und wenn es nur über diesen Anbieter ist. Jedoch wird nicht alles bei diesem Anbieter gesichert. Dies würde ansonsten wirklich den Rahmen sprengen. Denn wenn man bedenkt, wie viele Videos heute im Internet zu finden sind, von denen 1996 noch keine Rede war, dann kann man sich gut vorstellen, aus den zehn Petabyte würden schnell 100 oder 1.000 Petabyte (1 Exabyte) werden.

Kalender bei archive.org für eine Webseite

Kalender bei archive.org für eine Webseite

Ein Projekt im Webarchiv

Ich habe für eine unserer Webseiten einmal eine Zeitreise durch das Web unternommen und bin dabei auf folgende interessanten Screenshots gestoßen.

 

Wie man archive.org nutzen kann

Kauf von Domains

Wenn wir eine Domain kaufen, nutzen wir vorher archive.org. Wir geben den Namen der Domain bei der Suche des Webarchives ein und prüfen, ob und welche Inhalte sich auf der Webseite befanden. Mit dieser Recherche finden wir heraus, ob eine Domain “verbrannt” ist oder man diese ohne weiteres kaufen kann.

Recherche von AGB

Bericht von 2010: Vor ein paar Jahren passierte Folgendes. Ein Provider mit denen wir einen Vertrag geschlossen hatten, meldete sich auf einmal bei uns, da das Transfervolumen in die Höhe geschossen war. Durch unseren Downloadordner sprengten wir die acht Terrabytegrenze, sehr zum Missfallen des Providers. Er wies uns aus diesem Grund auf seine AGB hin, in denen hinterlegt war, ab einem Volumen von einem Terrabyte würden Zusatzkosten fällig werden. Leider konnte ich mich an diesem Passus nicht mehr erinnern und forschte nach, ob es sich hierbei um eine falsche Aussage handelte. Bei Archive.org fand ich einen Eintrag zur Webseite, welcher zu der Zeit erstellt wurde, als wir den Vertrag mit dem Provider abschlossen. In diesem fand ich auch die alten AGB (in der die Zusatzkosten nicht vermerkt waren) und konnte damit die Zusatzkosten abwenden.

Quellen und Links:

archive.org
de.wikipedia.org/wiki/Internet_Archive