Archive und Datenbanken

Aus AutarkWiki
Zur Navigation springen Zur Suche springen
BOOKs-www-clker-com.png

Vorwort

Archive sind wichtig! Archive stellen das „Gedächtnis“ einer Hochkultur dar. Auf Archive wird zurückgegriffen, wenn Fragen wie „Wie haben die Menschen damals gelebt?“ auftauchen. Viele Wissenschaftler, nicht nur Historiker, führen umfangreiche Recherchen in Archiven durch.

KURSIV: Wer wissen will wohin wir gehen, muss wissen wo wir herkommen. Die Geschichte wiederholt sich, wenn manches sich nicht wiederholt, muss nachgeforscht werden, wie es dazu kam.

Ich arbeitete in einem genialen Archiv. Viele Bilder, Dokumente, mussten eingesehen und abgelegt werden. Die Ablage war nicht schwer, das Auffinden des gewünschten Dokumentes dagegen gestaltete sich etwas schwieriger. Dies hat etwas mit dem jeweiligen Ablagesystem zu tun. Dokumente können nach Alphabet, Datum oder Thema abgelegt werden. Oder nach einem selbst erdachten Ablagesystem, das dem Charakter des Inhaltsverzeichnisses eines Buches ähnelt (Thesaurus).

“Analoge“ Verwaltung

Dazu werden alle relevanten Informationen auf Karteikarten geschrieben, um das Auffinden des gewünschten Dokumentes zu erleichtern.

Über die Arbeit eines guten Archivars wurden ganze Bücher geschrieben (Über den Umgang mit Historischen Büchern, Bildern & Dokumenten), die ich an dieser Stelle nicht wiederholen möchte, da es den Rahmen dieses Artikels sprengen würde.

Das Ärgernis eines Archivars ist ständig, dass Dokumente immer und immer wieder eingesehen und mit einem einfachen Kopierer vervielfältigt werden. Dass dies dem Dokument nicht „gut tut“ liegt auf der Hand. Die harte Strahlung des Kopiergerätes lässt die Druckfarbe ausbleichen. Die mechanische Belastung des Papiers ist auch nicht unerheblich und lässt die Qualität der schon alten Dokumente und Bücher nicht besser werden.

Digitalisierung

In „meinem“ Archiv wo ich tätig war, ging man dazu über, alle wertvollen Bilder & Texte zu digitalisieren. Dieses war eine sehr lobenswerte Maßnahme, die meine volle Unterstützung bekam.

Der einzige Kritikpunkt lag darin begründet, dass das Ordnersystem eines Rechners rein hierarchisch aufgebaut ist. Von A bis Z von 001 bis 999 usw. und Verzeichnis & Unterverzeichnisse (Verzeichnis = Ordner). Wenn man nur ein Dokument sucht und nicht genau weiß, wo man suchen muss, wird es zeitaufwändig. Entweder durchsucht man die Festplatte manuell oder man nutzt die interne Suchfunktion des Rechners.

Die Erfahrung hat gezeigt, dass das Durchsuchen einer Festplatte oft länger dauert, als das Durchsuchen des richtigen Archivs.

Datenbank

Darauf hin wurde angedacht eine Datenbank zu stellen. Eine Datenbankstruktur hat den Vorteil schnell Informationen aufzufinden. Im lokalen Netzwerk (Intranet), nicht zu verwechseln mit dem Internet, verwaltet ein Datenbankserver die Informationen und viele Benutzer können gleichzeitig auf abgespeicherte Datensätze zurückgreifen.

Der große Vorteil liegt darin, dass viele auf digitalisierte Dokumente zurückgreifen können. Die Suche und das Auffinden des gewünschten Dokuments gehen sehr schnell. Wissenschaftler & Historiker kommen so schneller an die gewünschten Informationen und beenden schneller ihre Recherche.

Die originalen Dokumente liegen sicher im Archiv und werden nicht mehr unnötigen mechanischen Belastungen ausgesetzt.

Eine weitere interessante Begebenheit: scannt man ein Foto, Bild oder Dokument mit z.B. 600 bis 1000 pix kann man mehr Details wahrnehmen, als es beim Original möglich ist. Durch digitale Bildbearbeitung (höchst umstritten) können Kontraste, Helligkeit und Farbwerte manipuliert werden. Dadurch kann die Qualität und die Lesbarkeit eines Dokumentes verbessert werden.

Scannen mit:

  1. 100 pix entspricht: 100% also das Bild ist mit der gleichen Größe wie im Original.
  2. 200 pix entspricht: die doppelte Größe des Bildes wie beim Original
  3. 600 pix entspricht: die sechsfache Größe des Bildes

Dies gilt auch für die Aufnahmen einer Digitalkamera.

Die Erfahrung lehrt, dass eine Auflösung von 600 pix für viele Dokumente und Bilder vollkommen ausreichend ist. Bei dieser Auflösung werden Details sichtbar, die im Original nicht aufgefallen wären.

Die Qualität der Kopie ist besser als beim Original

Ich hatte seinerzeit den Auftrag bekommen, nach einer passenden Datenbank „Ausschau“ zu halten, die allen Ansprüchen des Archivs gerecht wird.

Angefangen von einer „einfachen“ MS Access Datenbank, über eine Freeware Datenbank, die das Deutsche Museum (Berlin) verwendet, verschiedene PHP Bild Verwaltungsprogramme.

Das Problem bei vielen dieser Datenbanken ist der Schulungsaufwands des Archivpersonals. Wenn externe Wissenschaftler & Studenten Zugriff auf die DB des Archivs erhalten sollen, müssen sie erst in die verwendete Datenbank eingewiesen werden.

MediaWIKI Wissensdatenbank

Auf der Suche nach der passenden Datenbank kam ich zur MediaWIKI Wissensdatenbank. Die MediaWiki ist ein CMS Content Management System. Auf Deutsch: Inhalt Verwaltungssystem. Ergo ein System, das Inhalte (Texte & Bilder) verwaltet. Da dieses System auf einer Datenbank aufsetzt, ist die Suche nach dem gewünschten Dokument kein Problem. Die Inhalte werden ansprechend als Webseite dargestellt und Bilder können als kleine Vorschaubilder oder in Galerien dargestellt werden. Einzelbilder können in vorgefertigten Bildmasken (Vorlagen) präsentiert werden.

Jeder, der in der Wikipedia nachgeschlagen hat, wird sich in einem lokalen Archiv mediawiki sofort zurechtfinden und benötigt keine Einweisung in das System. Junge Studenten werden sich freuen, mit solch einem System arbeiten zu können.

Kosten

Die Kosten solch eines Systems sind minimal. Der benötigte Datenbank & Webserver ist Freeware, das Mediawiki ist ebenfalls Freeware und verursacht keinerlei Lizenzgebühren. Vergleichbare Systeme, die von Firmen geschrieben werden, kosten ab 10 000 Euro aufwärts. Interessant ist es zu beobachten, dass Softwareschmieden auf Programmteile zurückgreifen, die ohnehin frei sind und mit offenem Quelltext angeboten werden. Dies ist allerdings das gute Recht der Softwareentwickler, da viele Softwaremodule, die für kommerzielle Zwecke geschrieben wurden, dem „Internet“ zurückgegeben werden.

Die Kosten eines leistungsstarken Rechners (ein handelsüblicher Personalcomputer), der als Server dienen kann, sinken von Jahr zu Jahr.

Kritik

““Ich kenne die WIKIPEDIA und jeder kann darin schreiben und Inhalte verändern!““

““Die Qualität der WIKIPEDIA lässt zu wünschen übrig, deshalb nehme ich die WIKIPEDIA nicht ernst“““

Solche und noch viele anderen Einwände schlagen mir immer wieder entgegen wenn ich über die Mediawiki schreibe.

Zum ersten Kritikpunkt: die Wikipedia ist nicht zu verwechseln mit der mediawiki Software. Jedes CMSystem bringt eine Benutzerverwaltung mit. Ich halte entgegen in dem ich dem geneigten Leser anbiete, diesen Artikel zu verändern. Erstens wurde der Artikel geschützt: kein unangemeldeter Benutzer kann diesen Artikel verändern. Man kann zwar den Quelltext einsehen, das war es auch schon. Auf „normalen“ Webseiten kann man sich den Quelltext ebenfalls anschauen. Dazu klickt man auf die rechte Maustaste (innerhalb der Webseite) und klickt dann auf "Quelltext anzeigen".

Zweitens versuchen sie, sich auf diesem Themen-Wiki anzumelden. Dies wird ihnen nicht gelingen, da dies unterbunden wurde.

Ein MediaWiki kann man also gegen ungebetene Gäste und „Späm“ absichern.

Zum zweiten Kritikpunkt: Erstens ist eine Datenbank im Intranet keine WIKIPEDIA und zweitens, wenn ihnen einige Artikel nicht gefallen, ändern sie diese soweit ab, bis sie ihrem Qualitätsanspruch genügen. Davon lebt die Wikipedia, die ich vollkommen unterstütze.

Archive ins Netz

Bislang habe ich nur von einer Wissensdatenbank im Intranet, bzw. einem Archiv im Museum geschrieben. Ein lokales Netzwerk, auf das nur autorisiertes Personal Zugriff hat. Eine Schlagzeile in der Presse lautete vor Jahren: Archive ins Netz. Eine geniale Idee, die leider nur unzureichend bis gar nicht realisiert wurde. Das empfinde ich als sehr schade, da interessierten Laien der Zugriff auf das Material, das in Archiven und Lagerräumen schlummert, verwehrt bleibt. Viele Unterlagen, Bild- und Tondokumente verstauben und bleiben ungenutzt liegen. Auch hier kann ein Wiki-System genutzt werden. Ausgesuchte Dokumente können leicht aus dem lokalen Wiki ins Netz exportiert (Markieren Kopieren Einfügen) werden.

Je mehr Dokumente für das Internet freigegeben werden, umso bekannter wird das Quellarchiv. Dies zieht wiederum viele Studenten und Wissenschaftler an.

Und was ist mit dem digitalen Loch?

Die es nicht wissen: Das digitale Loch bezeichnet einen Informationsverlust, der durch Defekte in IT Systemen verursacht wurden. Diese Gefahr ist natürlich immer gegeben. Im Archiv, in dem ich tätig war, lagern viele Disketten und Daten CDs. Vor allem Disketten können in den nächsten Jahren nicht mehr gelesen werden, da moderne PCs ohne Floppylaufwerk ausgeliefert werden. Allerdings ist die Gefahr des Datenverlustes durch „Auflösungserscheinungen der Magnetschicht“ auf diesen Datenträgern wesentlich höher. Man sagt, ca. 5 Jahre halten Daten auf einer Diskette. Dies kann durch Kopieren auf Festplatten vermieden werden! Auch CDs sind nicht die erste Wahl beim Speichern von Informationen. Ich plädiere also dafür, alle Informationen, die schon über Jahre angehäuft wurden, gleich in eine DB einzupflegen! Ein Raid System, in dem gleichzeitig mehrere Festplatten innerhalb eines PCs beschrieben werden, erhöhen die Datensicherheit ins Unermessliche. Tägliche, wöchentliche oder monatliche Backups auf externe Festplatten (z.B.: USB Festplatten), die in einem Stahlschrank oder besser in einem Tresor aufbewahrt werden, geben zusätzliche Sicherheit.

Das Analoge Loch

Sprechen wir einmal vom Analogen Loch. Schon heute ist es schwierig, alte VHS Bänder anzuschauen. Von der guten alten Magnetkassette oder von Magnetbändern sprechen wir erst gar nicht. Hier wird es in den nächsten Jahren „kriminell“. Erstens entmagnetisieren sich diese Datenträger über die Jahre, die Qualität wird immer schlechter und zum zweiten wird es schwierig und sehr teuer, geeignete Abspielgeräte zu erwerben.

Selbst Dokumente auf Papier oder Fotos, sowie Microfilm verlieren über die Jahre an Qualität. Ein Unglück wie Brände, Wassereinbrüche und vieles mehr können wertvolle Dokumente für immer vernichten! Die Kosten für eine Restauration von nur einem Dokument sind beträchtlich.

Ich kann nur jeden Museumsleiter und Archivar ans Herz legen, eine Kopie, in welcher Form auch immer, von Dokumenten anzufertigen.

Digitale Datenhaltung und Erhaltung

Warum sollten digitale Datenhaltung und Erhaltung besser sein, als alles andere? Selbst ich als IT Spezialist bin dafür, unter allen Umständen das Original zu erhalten! Allein das Papier, auf dem das Dokument verfasst wurde, sagt viel über die damalige Zeit aus und kann nicht durch eine digitale Reproduktion ersetzt werden.

Allerdings steht auch die Frage der Wirtschaftlichkeit im Raum. Wie teuer ist es, ein halbverbranntes Dokument zu retten, das nicht unbedingt von großer historischer Bedeutung ist? Ich weiß, viele Professoren für Geschichte wollen am liebsten jeden noch so kleinen Papierfetzen aufbewahren. Aber was ist mit den Dokumenten, die vollständig und unwiederbringlich zerstört wurden? Eine hochaufgelöste digitale Kopie kann man für die Ewigkeit aufbewahren und das Auffinden stellt in der heutigen Zeit ebenfalls kein Problem dar. Wenn sich Archive untereinander einig sind, könnten Festplatten von einem Archiv beim anderen Archiv gelagert werden.

Ein Beispiel von nur 5 Archiven, die im Verbund arbeiten

Jedes Archiv hat den größten und wichtigsten Teil seiner Dokumente auf einer Festplatte zusammengefasst. Es werden 5 Kopien dieser Festplatte erstellt, jedes Archiv bekommt eine Kopie des jeweiligen Archivs. Jedes Archiv besitzt eine Kopie (einschließlich der eigenen) der 5 Festplatten. Sollte nun eines der Archive durch ein Unglück (Brand) vollständig zerstört werden, liegen immer noch 4 Kopien sicher in den anderen Archiven. Auch wenn 3 Festplatten über die Zeit defekt geworden sein sollten, existiert noch eine vollständige und funktionstüchtige Festplatte. Allein mit diesem System entsteht kein Digitales Loch.

Bis zum Ende aller Tage

Werden nun große Archive für das Internet freigegeben und die Benutzer und Universitäten machen sich eine Kopie (wenn auch nur ein Teil der Datenbank), wird sicher gestellt, dass ein wirklich wichtiges Dokument für immer erhalten bleibt. Wichtige Dokumente und Bilder werden so oft reproduziert (ausgedruckt), dass man davon ausgehen kann, dass diese Information für immer erhalten bleibt.

Und dies ist die wichtigste Aufgabe eines Archivs: Informationen für immer „bis zum Ende der Welt“ aufzubewahren und zu verwalten.

Haltbarkeit von Speichermedien

Eine kleine Übersicht über die Haltbarkeit von Speichermedien

CDs : Wenn die Dateien aufgebrannt sind zwischen 5 und 10 Jahren.
DVDs : Wenn die Dateien aufgebrannt sind rund 30 Jahr


CDs : Wenn die Dateien aufgepresst sind zwischen 50 und 80 Jahre
DVDs : Wenn die Dateien aufgepresst sind rund 100 Jahre


Disketten : 5 - 10 Jahre

Festplatten im laufenden Betrieb : 2 - 10 Jahre, im Mittel 5 Jahre, je nach täglicher Betriebsdauer.

Festplatten nicht im Betrieb : Nicht bekannt

Magnetbänder : ca. 30 Jahre

Mikrofilm : ca. 500 Jahre

Bücher und Handschriften aus säurefreiem Papier und Tinte : mehrere hundert Jahre

Bücher und Handschriften aus säurehaltigem Papier und Tinte : 70 - 100 Jahre

Und was NEUES: Cranberry DiamonDisc (spezielle DVD Verarb. ) : 1000 Jahre laut Hersteller.
Eine Disc kostet rund 35 US-Dollar
Das Brenngerät kostet rund 5000 US-Dollar
Disc lassen sich auf gewöhnlichen Playern abspielen.

Zusammenstellung:

Archive und Datenbanken, Ordnungssysteme in der EDV, Allgemeiner Aufbau eines Wikiartikels, Erstellen eines neuen Wikiartikels, Hochladen und einbinden von Bildern und Grafiken

Autor: André Pohle

Green copyright55.png
Diese Datei ist urheberrechtlich geschützt. Der Urheberrechtsinhaber gestattet jedermann (auch außerhalb und völlig unabhängig von der survival-mediawiki) jegliche Nutzung, so weitreichend, wie dies gesetzlich möglich ist (u. a. Verwendung für jeden Zweck, Aufführung, Weiterverbreitung, kommerzielle Nutzung, Bearbeitung) weltweit und zeitlich unbeschränkt unter der Bedingung der angemessenen Nennung seiner Urheberschaft (z. B. in der Bildunterschrift).