Datenarchiv

Aufbereitung

Sind die Daten vom Archiv angenommen und zur Gänze an das Archiv übergeben, beginnt das Archiv mit der Aufbereitung der Daten. Dazu gehören:

1. Prüfung auf Vollständigkeit der Daten und der Metadaten

  • Eine Reihe von Tests soll sicherstellen, dass die Daten dem angegebenen Inhalt entsprechen und in sich logisch und kohärent sind. Anfallende Fehler oder Fragen werden an die DatenerheberInnen zurückgegeben. Das Datenarchiv wird im Regelfall fehlerhafte Daten nicht bereinigen.
  • Weitere Überprüfungen der Daten sollen sicherstellen, dass eine ausreichende Dokumentation vorhanden ist, sodass potentielle NutzerInnen den Forschungszweck und Erhebungsprozess nachvollziehen können.

2. Prüfung auf Prüfung auf Anonymität der Befragten

  • Durchführung einer Reihe von Kontrollen auf Vertraulichkeit und Anonymität der Befragten. Dies beinhaltet zuerst eine Überprüfung auf eine offensichtliche Verletzung: Das Vorhandensein von Namen und Kontaktinformationen. In diesem Fall werden die Daten an die DatengeberInnen zur Korrektur retourniert.
  • Sollten durch Verknüpfung von Variablengruppen, Rückschlüsse auf vertrauliche Informationen möglich sein, werden die Daten ebenfalls retourniert.
  • Erwägung weiterer rechtlicher Gesichtspunkte.

3. Erstellung eines Datenkatalogeintrags

  • Die Archive werden in den meisten Fällen einen Katalogeintrag im Internet erstellen um eine Suche nach den und das Bestellen von Daten zu ermöglichen. Der Katalogeintrag beschreibt den Inhalt der Datenerhebung sowie Details über den Ursprung der Daten. Viele der CESSDA Archive stützen diesbezüglich auf den DDI (Data Documentation Initiative) Dokumentationsstandard. Dabei handelt es sich um einen XML basierenden Metadatenstandard, welcher verwendet wird, um Kataloginformationen zu erfassen und zu speichern. Dieser erlaubt den Austausch von Metadaten mit anderen Archiven in der Form von gemeinsamen, archivübergreifenden Datenkatalogen, bspw. dem CESSDA Webkatalog. DDI beinhaltet alle Dublin Core Schlüsselfelder und kann in der ISAD(G) (International Standard Archival Description (General)) abgebildet werden.

4. Konvertierung der Daten und Metadaten in geeignete Weitergabeformate

  • Nachdem alle Tests zufriedenstellend abgeschlossen und alle aufkommenden Probleme gelöst wurden, wird das Datenmaterial in geeignete Weitergabeformate konvertiert. In vielen Fällen bedeutet dies einen Transfer in geeignete, effektive und effiziente Weitergabeformate. Dies ist benutzerfreundlich, da üblicherweise die Konvertierung in standardmäßig von der NutzerInnengemeinschaft verwendete Softwareformate durchgeführt wird. Auch die Metadaten werden in leicht handhabbare PDF-Formate konvertiert, die über Archiv- und CESSDA Webseiten downgeloadet werden können.