Internet Archive
{{Infobox Website
| Name = Internet Archive
| Logo = Datei:Internet Archive.jpg
| url = http://www.archive.org
| Slogan = Universal access to human knowledge
| Kommerziell = gemeinnützig
| Beschreibung = Web-Archivierung
| Sprachen = Oberfläche engl.
| Registrierung = optional
| Eigentümer = Internet Archive, San Francisco CAInternet Archive: [http://www.archive.org/about/contact.php Contact]
| Urheber = Brewster Kahle
| Erschienen = 1996
| Jahreseinnahmen =
| Status =
}}
Das Internet Archive in San Francisco ist ein gemeinnütziges Projekt, das 1996 von Brewster Kahle gegründet wurde. Es hat sich die Langzeitarchivierung digitaler Daten in frei zugänglicher Form zur Aufgabe gemacht.
Es speichert Momentaufnahmen von Webseiten, Usenet-Beiträgen, Filmen, Tonaufnahmen (einschließlich von Live-Konzerten), Büchern und Software. Ein Spiegelserver der Daten von San Francisco befindet sich in der Bibliotheca Alexandrina.
Dienste
thumb|Internet Archive in San Francisco (1996-2009)thumb|Neue Zentrale des Internet Archive seit November 2009 in einer ehemaligen [[Christian Science-Kirche]]
thumb|Internet Archive in der [[Bibliotheca Alexandrina. Hinter den Glasscheiben stehen die Racks mit den Archivcomputern.]]
Zum Web-Archiv gehört die Wayback Machine („Take Me Back“), mit der man die gespeicherten Webseiten in verschiedenen Versionen abrufen kann. Die Auswahl der zu speichernden Seiten erfolgt über den Dienst Alexa Internet. Alle dort hinterlegten URLs werden regelmäßig aufgerufen und archiviert. Der Gesamtumfang betrug im November 2009 etwa 150 Milliarden Seiten. Die Seiten werden erst ca. sechs Monate nach dem Indexieren öffentlich verfügbar gemacht.
In dem Million Book Project werden durch das Internet Archive Bücher, die durch das Ablaufen des Copyrights (US-amerikanisches Urheberrecht) oder aus anderen Gründen gemeinfrei geworden sind, digitalisiert und in den Dateiformaten DjVu, TIFF und PDF zum Herunterladen zur Verfügung gestellt. Die Digitalisate sind Teil der Open Library.
Es werden mehrere Scan-Center (2009 insgesamt zwölf) unterhalten, zum Beispiel in Richmond. Gescannt wird per Auftrag, berechnet werden pro Seite zehn US-Cent (Stand 2009). Die Auftraggeber, meist Bibliotheken, erhalten das Digitalisat, eine per OCR erstellte Textdatei, eine persistente Internetadresse sowie die Möglichkeit, die Digitalisate auf den Servern des Vereins zu hosten.[http://www.zeit.de/2008/04/OdE13-Wissen?page=2 Das digitale Alexandria]. Die Zeit4/2008
Weiterhin bestehen Kooperationsvereinbarungen mit selbst digitalisierenden Bibliotheken für einzelne Dienste, wie OCR und redundantes Hosting.Die Library of Congress hat im Dezember 2006 sechs Ausnahmen des US-Copyright-Gesetzes Digital Millennium Copyright Act gewährt.[http://www.theregister.co.uk/2006/12/01/internet_archive_copyright_reprieve/ Internet Archive wins copyright reprieve], The Register, 1. Dezember 2006 Das Internet Archive darf somit Computer-Software oder -Spiele mit der Absicht der Erhaltung speichern, wenn die Originalhardware, -formate oder -technologie veraltet sind.
Das Archiv hat eine geschätzte Größe von drei Petabyte und wächst um ca. 100 Terabyte pro Monat.[http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top Internet Archive to unveil massive Wayback Machine data center], Computerworld, abgerufen am 26. März 2009 Das Archiv ist vom US-Bundesstaat Kalifornien seit Anfang Mai 2007 offiziell als Bibliothek anerkannt.Internet Archive forum: [http://www.archive.org/iathreads/post-view.php?id=121377 Internet Archive officially a library]
Kritik
Problematisch an der Wayback Machine ist zum einen, dass auch Inhalte erhalten bleiben, die die Autoren nicht mehr vertreten. Auch rechtswidrige Inhalte, etwa üble Nachreden, werden über Jahre der Öffentlichkeit zugänglich gemacht. Dies lässt sich jedoch durch eine entsprechende robots.txt-Datei[http://www.archive.org/about/exclude.php Internet Archive], abgerufen am 26. Januar 2012 im Stammverzeichnis der Domain beheben.
Zum anderen wird nicht alles gesichert, beispielsweise werden Bilder von Internetseiten häufig nicht mitgesichert und stehen nach dem Verschwinden der Originalseite nicht mehr zur Verfügung.
Siehe auch
* WebCite
Weblinks
{{Commonscat|Internet Archive}}
* [http://www.archive.org Offizielle Website] (englisch)
**[http://waybackmachine.org WayBack Machine], BETA Version
:(enthält nach 2008 archivierte Inhalte, die über die [http://www.archive.org/web/web.php Standard-Version] nicht erreichbar sind)
* [http://www.archive.org/details/millionbooks Million Book Project] (englisch)
* [http://www.bibalex.org/isis/frontend/archive/archive_web.aspx Mirrorseite des Webarchivs] bei Bibliotheca Alexandrina
* Technology Review: [http://www.heise.de/tr/artikel/54303 Online in die Vergangenheit (Artikel bei Heise.de)]
* [http://web.archive.org/*/de.wikipedia.org/ Beispiel für die Wayback Machine] (benötigt Javascript)
* [http://www.elektrischer-reporter.de/index.php/site/film/13/ Video-Interview mit Internet-Archiv-Gründer Brewster Kahle]
Einzelnachweise
Kategorie:Digitale Bibliothek
Kategorie:Kinemathek
Kategorie:Internetdienst
Kategorie:Geschichte des Internets
ar:أرشيف الإنترنتbg:Internet Archive
ca:Internet Archive
cs:Internet Archive
da:Internet Archive
el:Internet Archive
Internet Archive
es:Internet Archive
et:Interneti arhiiv
fa:بایگانی اینترنتی
fi:Internet Archive
Internet Archive
he:ארכיון האינטרנט
hr:Internet Arhiv
hu:Internet Archive
it:Internet Archive
ja:インターネット・アーカイブ
ko:인터넷 아카이브
nl:Internet Archive
no:Internet Archive
pl:Internet Archive
pt:Internet Archive
ro:Internet Archive Wayback Machine
ru:Архив Интернета
simple:Internet Archive
sv:Internet Archive
ta:இணைய ஆவணகம்
th:อินเทอร์เน็ตอาร์ไคฟ์
tr:Internet Archive
uk:Інтернет-архів
zh:互联网档案馆
Text und Bilder dieses Beitrags stammen aus dem Artikel Internet Archive der freien Enzyklopädie Wikipedia und stehen unter der GNU Free Documentation License. Die Liste der Autoren ist in der Wikipedia unter dieser Seite verfügbar, der Original-Artikel lässt sich hier bearbeiten.