Der Datenlebenszyklus
"Data archiving is a process, not an end state where data is simply turned over to a repository at the conclusion of a study. Rather, data archiving should begin early in a project and incorporate a schedule for depositing products over the course of a project's life cycle and the creation and preservation of accurate metadata, ensuring the usability of the research data itself. Such practices would incorporate archiving as part of the research method." (Jacobs, James A., and Charles Humphrey (2004). "Preserving research data." Communications of the ACM. 47(9), 27–29.)
Datensätze haben eine längere „Lebensdauer“ als die Forschungsprojekte, in denen sie generiert werden. Auch das Datenmanagement beschränkt sich als Aufgabe daher nicht nur auf den Moment, an dem ein Datensatz an ein Archiv übermittelt wird, sondern findet während des gesamten Datenlebenszyklus statt. Um sicherzustellen, dass Daten, die man heute erhebt, auch in der Zukunft genutzt werden können, sollten schon früh im Forschungsprozess Fragen der Datenstruktur und des Datenformats, sowie Standards der Daten- und Metadatendokumentation bedacht werden. Im Forschungsprozess wird Datenmanagement idealerweise von ProjektmitarbeiterInnen, im Zuge der Archivierung von ArchivarInnen betrieben. Der Wert eines archivierten Datensatzes hängt fundamental von der Qualität und Effizienz des Datenmanagements ab.
Die folgende Darstellung zeigt die sieben wichtigsten Phasen des Datenlebenszyklus und die dabei anfallenden Management- und Dokumentationstätigkeiten. Die Unterkapitel behandeln die einzelnen Phasen jeweils genauer.
| Phase 1 |
Antragstellung |
Sichtung bestehender Datensätze; Bestimmung der Bereiche, wo Notwendigkeit für neue Forschung besteht und spezifischer Herausforderungen, die sich bei einer Archivierung stellen könnten.
Identifizierung potentieller NutzerInnen; Ermittlung der mit der Archivierung verbundenen Kosten.
|
| Phase 2 |
Startphase des Projekts, Datenmanagement |
Erstellung eines Datenmanagementplans; Entscheidungen über Form und Inhalt der Datendokumentation; Durchführung von Pre-Tests. |
| Phase 3 |
Datenerhebung und -dokumentation |
Vorgehen nach best-practice: Datenerhebung; Digitalisierung und Datenverarbeitung (Transkription, Eingabe in SPSS); Datenkontrolle und -bereinigung; Erstellung von Informationen über die Daten zu allen relevanten Aspekten (Art der Transkription, Gewichtungsverfahren, Merkmalsausprägungen, etc.). |
| Phase 4 |
Datenanalyse |
Aufbereitung zur und Analyse der Daten; Erstellung der finalen Datendokumentation; Handhabung des endgültigen Datensatzes; Erstellung einer passenden Filestruktur; Erstellung von Backups. |
| Phase 5 |
Aufbereitung der Daten für die Datenweitergabe |
Weitere Überprüfung und Bereinigung der Daten; Verknüpfungen zwischen Daten; Adressieren von Veröffentlichungsrisiken; Anonymisierung; Bestimmung der Datenformate für die Weitergabe; Kontaktieren eines Archivs. |
| Phase 6 |
Archivierung der Daten |
Abgabe relevanter Formulare und Verträge; Einhalten relevanter Weitergabestandards und -formate. |
| Phase 7 |
Archivarische Aktivitäten |
Lagerung; Metadatenerstellung; Überprüfung von Vertraulichkeitsansprüchen; eventuell Aufbereitung der Daten für Online-Zugang; Weitergabe der Daten an SekundärnutzerInnen außerhalb des ursprünglichen Projektzusammenhangs; Verlinkung zu anderen Datensätzen; Support für DatennutzerInnen. |
(Quelle: ICPSR Guide to Social Science Data Preparation and Archiving.)