Langzeitarchivierung
{{Redundanztext
|3=Langzeitarchivierung
|4=Digitales Archiv
|12=t|2=Mai 2011|1=ChristophLZA 15:15, 11. Mai 2011 (CEST)}}
Unter Langzeitarchivierung versteht man die Erfassung, die langfristige Aufbewahrung und die Erhaltung der dauerhaften Verfügbarkeit von Informationen. Vor allem bei der Langzeitarchivierung digital vorliegender Informationen (digital preservation) stellen sich neue Probleme. 'Langzeit' bedeutet für die Bestandserhaltung digitaler Ressourcen nicht die Abgabe einer Garantieerklärung über fünf oder fünfzig Jahre, sondern die verantwortliche Entwicklung von Strategien, die den beständigen, vom Informationsmarkt verursachten Wandel bewältigen können.Ute Schwens, Hans Liegmann: Langzeitarchivierung digitaler Ressourcen. In: Rainer Kuhlen, Thomas Seeger, Dietmar Strauch (Hrsg.): Grundlagen der praktischen Information und Dokumentation. 5., völlig neu gefasste Ausgabe. München: Saur, 2004, S. 567
Definition
Eine allgemein gültige Definition des Begriffes existiert bislang nicht. Da Archive Archivalien zunächst immer für die Ewigkeit aufbewahren, handelt es sich bei dem Begriff Langzeitarchiv zudem eigentlich um einen Pleonasmus.
Da viele der Probleme der digitalen Langzeitarchivierung erst nach etwa 10 Jahren auftreten, etwa große Versionssprünge der verwendeten Software, wird dieser Wert als Schranke für die Überlegungen zur Langzeitarchivierung verwendet. Zudem lässt sich so die Langzeitarchivierung vom Backup abgrenzen.
Probleme
Während physikalische Objekte seit langer Zeit unter anderem in Archiven, Museen und Bibliotheken aufbewahrt und erhalten werden, stellen sich bei elektronischen Publikationen ganz neue Herausforderungen. Daten, die auf digitalen Datenträgern gespeichert sind, können in relativ kurzer Zeit nicht mehr lesbar sein („digitales Vergessen“). Die Ursachen für diesen Informationsverlust sind die begrenzte Haltbarkeit der Trägermedien und der schnelle Medien- und Systemwandel. Bei der Umgehung dieser Schranken bereiten unter anderem proprietäre Formate und urheberrechtliche Beschränkungen Probleme.
Haltbarkeit der Trägermedien
Während beispielsweise altes Pergament und Papier bei guter Lagerung viele hundert Jahre haltbar sind, trifft dies auf neue Speichermedien nicht zu. Die meisten Publikationen aus der ersten Hälfte des 20. Jahrhunderts sind auf Papier gedruckt, das sich durch Säurefraß zersetzt. Bei älteren Druckwerken und Handschriften stellen sich andere Probleme: Wurde eisenhaltige Tinte bei der Herstellung verwendet, können die Buchstaben durch Feuchtigkeitseinwirkung einfach wegrosten und Löcher in den Seiten zurücklassen. Feuchtigkeits- und Temperaturschwankungen können auch Pergamenthandschriften zusetzen, weil durch Dehnung und Kontraktion die aufgetragene Schrift abplatzen kann.
Auch Filme, Fotos und Magnetbänder haben nur eine begrenzte Haltbarkeit. Noch kürzer ist die Lebensdauer digitaler Speichermedien wie Disketten, Festplatten und gebrannte CDs/DVDs. Datenträger verlieren ihre Informationen durch Umwelteinflüsse (zum Beispiel durch Magnetfelder in der Nähe von Disketten oder Magnetbändern) oder sie werden durch chemische oder physikalische Einwirkungen so stark verändert, dass sie keine Informationen mehr speichern können oder nicht mehr auslesbar sind (zum Beispiel UV-Strahlung auf CD-ROMs). Oft scheitert die Lesbarkeit auch nur daran, dass zu einem späteren Zeitpunkt die passenden Geräte und Programme nicht mehr vorhanden sind. Um den vorgenannten Problemen zu entgehen, kann es sinnvoll sein, bestimmte ausgewählte elektronische Informationen (wieder) in die nichtelektronische Form (zurück) zu wandeln und diese – sozusagen als modernes Äquivalent der Sitte unserer Vorväter, wichtige Informationen dauerhaft in Stein zu meißeln – per Ionenstrahl in eine nahezu unverwüstliche Nickelplatte einzugravieren.
{| class="wikitable centered"|+ Lebensdauer einiger Datenträger bei 20 °C und 50 % rF
|- class="hintergrundfarbe6"
! Medium
! Erwartete Lebensdauer
! Speicherdichte (kbit/kg)
|-
| Steintafeln und Steinmalereien
| mehrere tausend Jahre (gesichert)
| 1·10−3 … 1
|-
| Nickelplatte
| mehrere tausend Jahre (vermutet)
| |-
| Bücher und Handschriften aus säurefreiem Papier und
mit säurefreier und nicht eisenhaltiger Tinte
| mehrere hundert Jahre (gesichert)
| rowspan=2 | 3·103 … 3·104
|-
| Bücher und Handschriften aus säurehaltigem Papier
(insbesondere Druckwerke des 19. und frühen 20. Jahrhunderts)
| 70 bis 100 Jahre
|-
| Zeitungspapier
| analog zu säurehaltigem / -freien Buchdruckpapier
| |-
| Filme auf Zelluloid (Cellulosenitrat)
| mehr als 100 Jahre (gesichert) und bis zu 400 Jahre (vermutet)
| |-
| Filme auf Cellulosetriacetat
| 44 Jahre (gesichert)
| |-
| Filme auf Polyethylenterephthalat (PET)
| Farbfilm bis zu 150 Jahre (vermutet) Schwarz/Weiß-Film bis zu 700 Jahre (vermutet)
| |-
| Optische Speichermedien
(gebrannt)b
|
- CD-R: 5 bis 10 Jahre
* CD-R mit 24k-Gold-Reflexionsschicht: bis zu 100 Jahre (laut Labortests), jüngst bei vereinzelten Anbietern widerlegt c't 16/2008, S.116, http://www.heise.de/ct/08/16/116/
* CD-RW: unklar, weniger als DVD-RAM vermutet
* DVD-ROM: unklar, weniger als DVD-RAM vermutet
* DVD±R: unklar, weniger als DVD-RAM vermutet
* DVD±RW: unklar, weniger als DVD-RAM vermutet
* DVD-RAM: 30 Jahre (vermutet)
* BD-R: bis zu 50 Jahre (laut Labortests)
| rowspan=2 |
* CD: 4·108
* DVD: 2…4·109
* BD: 2…4·1010
|-
| Optische Speichermedien (gepresst)
| - CDa: unter Idealbedingungen geschätzt 50-80 Jahrehttp://www.3sat.de/nano/bstuecke/119799/index.html
* DVD: min. 100 Jahre (vermutet)
* BD: 82 - 85 Jahre (vermutet)
|-
| Disketten als Archivmedien (ohne Betrieb)
| 10 bis 30 Jahre (datendichteabhängig?){{cite web|title=Digital Media Life Expectancy and Care|archiveurl=http://web.archive.org/web/20031222194846/http://www.oit.umass.edu/publications/at_oit/Archive/fall98/media.html|archivedate=2003-12-22|date=1998|url=http://www.oit.umass.edu/publications/at_oit/Archive/fall98/media.html|publisher=www.oit.umass.edu|author=Michael W. Gilbert|accessdate=2011-01-04}}{{cite web|url=http://www.softpres.org/glossary:bit_rot|title=Bit Rot|publisher=Software Preservation Society|date=2009-05-07|accessdate=2011-01-04}}
|
|Festplatten im laufenden Betrieb
| 2 bis 10 Jahre, je nach täglicher Betriebsdauer[http://www.heise.de/newsticker/meldung/85428 Heise-Meldung vom 16. Februar 2007]; abgerufen am 18. März 2009 [http://labs.google.com/papers/disk_failures.pdf Google Studie zur Haltbarkeit von Festplatten im Dauerbetrieb]: Abschnitt 3.1, Figure 2; abgerufen am 18. März 2009 (engl.), im Mittel 5 Jahrehttp://www.speicherguide.de/magazin/datentraeger.asp?todo=de&theID=58 (abgerufen am 18. März 2009)http://www.netzwelt.de/news/75456-haltbarkeit-von-speichermedien-wo-daten.html (abgerufen am 18. März 2009)
| rowspan=2 |
|-
| Festplatten als Archivmedien (ohne Betrieb)
| 10 bis 30 Jahre (Magnetmedium? datendichteabhängig?)
|-
| Magnetbänder
| mindestens 30 Jahre (gesichert)
| |-
| Iomega REV-Wechsellaufwerk
| bis zu 30 Jahre (vermutet)
| |-
| USB-Stick, Flash-Speicher
| 10 bis 30 Jahrehttp://www.netzwelt.de/news/75456_2-haltbarkeit-speichermedien-daten-richtig-liegen.html (abgerufen am 06. Februar 2012)
| |-
| colspan=3 class="hintergrundfarbe8" | a Ende der 1980er Jahre wurde mitunter pilzanfälliger oder sauerstoffdurchlässiger Kunststoff bzw. aggressive Farbe beim Bedrucken verwendet, was die Datenstabilität reduziert.
|-
| colspan=3 class="hintergrundfarbe8" | b Aufgrund der Tatsache, dass sich der Herstellungsprozess von BD-Rs noch in der Entwicklung befindet und es bei doppelschichtigen DVD±Rs systembedingt zu Leseproblemen kommen könnte, werden einschichtige (4,7 GB) DVD±Rs empfohlen.http://www.heise.de/ct/DVDs-im-Langzeittest--/artikel/126452 (abgerufen am 18. März 2009)
|}
Schneller Medien- und Systemwandel
Insbesondere bei digital gespeicherten Informationen besteht die zusätzliche Problematik, dass Daten nicht mehr zugänglich sind, obwohl das Medium selbst erhalten ist.
Auslesbarkeit des Speichermediums
Um auf gespeicherte Informationen zugreifen zu können, muss das jeweilige Trägermedium (aus)gelesen werden können. Bei einigen Medien wie Steintafeln oder Büchern kann dieses einem Menschen auch ohne Hilfsmittel möglich sein. Bei digital gespeicherten Medien ist zumeist ein entsprechendes Lesegerät, oft ein Laufwerk, notwendig. Sind keine Lesegeräte mehr erhältlich, ausgelöst beispielsweise durch technologischen Wandel, so können die Daten nicht mehr, oder nur noch unter Schwierigkeiten, ausgelesen werden. Ein Beispiel sind veraltete Bandformate.
Veraltete Datenformate
Auch wenn das Speichermedium erhalten und noch lesbar ist, könnte unter Umständen ein Zugriff auf die gespeicherten Informationen unmöglich sein. Da digital gespeicherte Informationen nicht unmittelbar zugänglich vorliegen, sondern binär codiert sind, ist es nur möglich, die Informationen zu lesen, wenn ein Programm und ein Betriebssystem vorliegen, die den Inhalt einer Datei „verstehen“. Da viele Betriebssysteme und Programme ein eigenes (proprietäres) Verfahren einsetzen, um die Daten zu codieren, ist eine Lesbarkeit von Daten nicht mehr sicher gegeben, wenn ein Betriebssystem oder ein Programm nicht weiterentwickelt wird. Verschärft wird dieses Problem durch die Politik vieler Softwarehersteller, neue Programmversionen mit veränderten Datenformaten zu veröffentlichen, die ältere Datenformate des gleichen Programms nicht vollständig nutzen können.
Weitere Beschränkungen
Proprietäre Systeme und urheberrechtliche Beschränkungen erschweren das zur Langzeitarchivierung notwendige Umkopieren und Migrieren von Daten, weil die dafür notwendigen Schritte nicht bekannt bzw. erlaubt sind. Vor allem die Einführung von Digitalem Rechtemanagement (DRM) wird das Problem in Zukunft noch verstärken. Ein derartiges Regelwerk für digitale Daten bzw. Dokumente ist deshalb notwendig, weil ebenso wie bei herkömmlichen Daten urheberrechtliche Fragen vor einer möglichen Archivierung geklärt werden müssen. Der Unterschied zwischen herkömmlichen Daten und elektronischen Dokumenten ergibt sich daraus, dass bei letzteren Kopie und Original praktisch nicht zu unterscheiden sind. Insbesondere bei der Migration von Dokumenten ist es notwendig, Kopien zu erstellen und evtl. Originaldokumente zu verändern. Daher ist das Einverständnis des Urhebers mit solchen Maßnahmen vorab einzuholen. Weitere Kopien, die an Leser von Dokumenten ausgehändigt werden, sind angemessen zu honorieren und müssen gegebenenfalls mit Sperrvermerken verbunden werden, wenn eine unentgeltliche Weitergabe nicht erlaubt ist.Uwe M. Borghoff u.a.: Langzeitarchivierung. Methoden zur Erhaltung digitaler Dokumente. dpunkt.-Verl., Heidelberg 2003, S. 21.
Auffinden von Informationen
Es ist nicht ausreichend, Originaldaten nur zu kopieren: Sie müssen auf dem neuen Medium auch wiedergefunden werden können.
Daher müssen Informationen über die Originaldaten, sogenannte Metadaten, in Kataloge, Datenbanken oder andere Findmittel eingetragen werden, um für eine spätere Suche zur Verfügung zu stehen.
Datenkonsistenz
Ein oft übersehenes Problem bei der Langzeitarchivierung wie auch bei der Kurzzeitarchivierung ist die Überprüfung der Fehlerfreiheit der Daten. Daten können absichtlich modifiziert werden, aber auch durch Systemfehler unbemerkt verändert werden.
Ein Ausweg könnte hier die verteilte Speicherung an verschiedenen Orten bei verschiedenen Organisationen und die Absicherung mit verteilt gespeicherten kryptographischen Prüfsummen sein. Dies wird u.a. mit der Open-Source Lösung LOCKSS praktiziert. In Deutschland exisistiert ebenfalls ein deutsches Projekt (LuKII), das dieser Forderung nachkommt.
Verfahren
Grundsätzlich lassen sich bei der elektronischen Archivierung Methoden der Migration/Konversion
und der Emulation unterscheiden.
Durch den Einsatz von offenen Standards wie zum Beispiel Grafikformaten (TIFF, PNG, JFIF) oder freien Dokumentenformaten (XML, PDF/A, OpenDocument), die als relativ langlebig betrachtet werden und deren Aufbau öffentlich bekannt ist, sind die Zyklen, nach denen eine Information umformatiert werden muss, länger. Die Wahrscheinlichkeit, dass es in einigen Jahren noch Systeme und Programme gibt, die die Daten lesen können, ist deutlich höher.
Um den Verlust von Daten durch die Alterung von Datenträgern zu verhindern, müssen die Daten regelmäßig innerhalb der garantierten Datensicherheitsdauer eines Mediums auf neue Datenträger kopiert werden. Dadurch kann auch auf ein neues Trägerformat gewechselt werden, wenn das bisher genutzte durch die technische Weiterentwicklung obsolet geworden ist.
Die hohen Kosten, die durch diese Pflege der Datenbestände entstehen, haben allerdings zur Folge, dass nur die wichtigsten Daten derart konserviert werden können. Die Informationsflut, die nicht zuletzt durch die neuen digitalen Datenverarbeitungssysteme entsteht, verschärft das Problem zusätzlich. Der Anteil der langfristig gespeicherten Daten wird notwendigerweise relativ gering sein, was an die Auswahl der gesicherten Informationen hohe Anforderungen stellt. Ein zusätzliches Problem entsteht durch das Auseinanderdriften des Verhältnisses zwischen Datenvolumen und Bandbreite. Das Volumen wächst deutlich schneller als die zur Verfügung stehende Bandbreite, um Daten von einem Medium auf ein anderes zu überspielen.
Dies betrifft nicht nur die Daten im staatlichen und kommerziellen Bereich. Auch im Privatbereich werden herkömmliche, oftmals langfristig lagerfähige Medien durch leichter handhabbare digitale Medien ersetzt (Fotografien und Negative durch digitale Bilder auf einer CD-ROM).
Für die Langzeitarchivierung sind in Deutschland die Pflichtexemplarbibliotheken und die Archive zuständig.
Siehe auch
* ArchiSafe
* Archiv
* Barbarastollen (Zentraler Bergungsort der Bundesrepublik Deutschland)
* Datenwiederherstellung
* Digitalisierung
* Dokumentenmanagement
* Elektronische Archivierung
* Elektronische Dissertation
* Enterprise Content Management
* Informationslebenszyklusmanagement
* Internet Archive, Web-Archivierung
* Kulturgut
* KEO
* Mikroform
* Netzpublikation
* OPENARCHIVE Open Source Langzeitarchivsoftware
* PDF/A (ein mögliches Format für digitale Langzeitarchivierung)
* Restaurierung
* Retrodigitalisierung
* Stein von Rosetta
* Rosetta-Projekt
* Long Now Foundation
* PEVIAR, Projekt zur Entwicklung migrationsloser Langzeitarchivierung digitaler Daten
* Preservation and Long-term Access through Networked Services
Literatur
* Heike Neuroth, Achim Oßwald, Regine Scheffel, Stefan Strathmann, Mathias Jehn: nestor Handbuch Eine kleine Enzyklopädie der digitalen Langzeitarchivierung, Hülsbusch, Mai 2009, ISBN 3940317489
* Ute Schwens, Hans Liegmann: Langzeitarchivierung digitaler Ressourcen. In: Rainer Kuhlen, Thomas Seeger, Dietmar Strauch (Hrsg.): Grundlagen der praktischen Information und Dokumentation. 5., völlig neu gefasste Ausgabe. München: Saur, 2004.
* Uwe M. Borghoff, Peter Rödig, Jan Scheffczyk, Lothar Schmitz: Langzeitarchivierung. Dpunkt Verlag, 2003 ISBN 3-89864245-3
* Ralf Blittkowsky: [http://www.heise.de/tp/deutsch/inhalt/te/16566/1.html Archivieren der Berechnungsformeln?]. In Telepolis. Heise-Verlag 14. Februar 2004
* Georg Hohmann: [http://www.heise.de/tp/deutsch/inhalt/konf/15955/1.html Digitale Ewigkeit und virtuelle Museen]. In: Telepolis. Heise-Verlag 30. Oktober 2003
* Ulrich Kampffmeyer, Jörg Rogalla: Grundsätze der elektronischen Archivierung. VOI-Kompendium Band 3. VOI Verband Organisations- und Informationssysteme e. V., Darmstadt 1997, ISBN 3-932898-03-6.
* Roy Rosenzweig: [http://chnm.gmu.edu/assets/historyessays/scarcity.html Scarcity or Abundance? Preserving the Past in a Digital Era]. In: American Historical Review 108, 3. Juni 2003, S. 735-762
* Guidelines for the Preservation of Digital Heritage. UNESCO, March 2003. http://unesdoc.unesco.org/images/0013/001300/130071e.pdf
* Digital Preservation Tutorial. Cornell. http://www.library.cornell.edu/iris/tutorial/dpm/
* Helfer, Bernward & Lupprian, Karl-Ernst (Bearb.): „Dateiformate. Eigenschaften und Eignung für die Archivierung elektronischer Unterlagen. Eine Handreichung für Archivarinnen und Archivare.“ Wiesbaden und München 2004. http://www.gda.bayern.de/datfor.pdf
* Bundesamt für Sicherheit in der Informationstechnik (Hrsg.), IT-Grundschutzhandbuch. (Hier: Abschnitt M 4.170: Auswahl geeigneter Datenformate für die Archivierung von Dokumenten, Stand 2007). https://www.bsi.bund.de/cln_183/ContentBSI/grundschutz/kataloge/m/m04/m04170.html
* [https://www.bsi.bund.de/cln_174/ContentBSI/Publikationen/TechnischeRichtlinien/tr03125/index_htm.html BSI Technische Richtlinie 03125: Beweiswerterhaltung kryptographisch signierter Dokumente]
* Digitale Archivierung von fotografischen Sammlungen – Ein Grundlagenbericht der Uni Basel und des Schweizerischen Kulturgüterschutzes. http://www.iml.unibas.ch/dokumente/KGS-Grundlagenbericht.pdf
* Katherine Skinner, Matt Schultz: [http://www.metaarchive.org/sites/default/files/GDDP_Educopia.pdf A Guide to Distributed Digital Preservation] (PDF, 156 S.), Educopia Institute Atlanta, 2010, Lizenz: [http://creativecommons.org/licenses/by-nc-nd/3.0/legalcode CC-BY-NC-ND-3.0], ISBN 978-0-9826653-0-5
* Thorsten Wetzenstein: [http://archiv.ub.uni-heidelberg.de/volltextserver/volltexte/2011/12106/ Digitale Langzeitarchivierung unter dem Aspekt des Access]. Diplomarbeit. Universität Heidelberg. 2010.
Weblinks
{{Wikibooks|Langzeitarchivierung}}
* [http://www.digitalpreservationeurope.eu/ DigitalPreservationEurope (DPE)]
* [http://www.langzeitarchivierung.de NESTOR Kompetenznetzwerk zur Langzeitarchivierung digitaler Quellen in Deutschland]
* [http://kopal.langzeitarchivierung.de/ kopal – Kooperativer Aufbau eines Langzeitarchivs digitaler Informationen]
* [http://www.kost-ceco.ch/wiki/whelp/KaD/ Die Koordinationsstelle für die dauerhafte Archivierug elektronischer Unterlagen des Schweizer Archivarsverbandes u.a. mit Details zu Archivformaten]
Einzelnachweise
Kategorie:Bibliothekswesen
Kategorie:Dokumentation
Kategorie:Retrodigitalisierung
Digital preservationText und Bilder dieses Beitrags stammen aus dem Artikel Langzeitarchivierung der freien Enzyklopädie Wikipedia und stehen unter der GNU Free Documentation License. Die Liste der Autoren ist in der Wikipedia unter dieser Seite verfügbar, der Original-Artikel lässt sich hier bearbeiten.