Datenarchiv

Erstellen eines Datensatzes

Dieser Abschnitt enthält eine Reihe von Best Practices für die Erstellung von Dateien und Datensätzen. Eine Orientierung an diesen Empfehlungen von Beginn an soll sicherstellen, dass Ihr Datensatz einfach und leicht zu handhaben ist und der Analyse-, Dokumentations- und spätere Archivierungsprozess leicht abzuwickeln ist.

Datenbereinigung

Es ist wichtig, Fehler die sich in jeden Datensatz einschleichen, ausfindig zu machen und zu korrigieren. Folgende Vorschläge sollen als Orientierung zur Fehlersuche und –korrektur dienen:

  • Verwendung eines Dateneingabeprogramms, welches Eingabefehler erkennt
  • Verwendung doppelter Eingabesysteme
  • Einführung zufälliger Qualitätskontrollen
  • Trennung der Dateneingabe und Datencodierung
  • Durchführung anspruchsvoller Tätigkeiten wie die Berufsklassifizierung durch qualifizierte MitarbeiterInnen
  • Computergestütztes Codieren, wenn möglich
  • Überprüfung auf unzulässige Werte
  • Variablenübergreifende Konsistenzüberprüfung
  • Erstellen integrierter Datensätze
  • Erstellen von Häufigkeitsauszählungen zur Kontrolle
Variablennamen
  • Verwendung von Standards hinsichtlich der Bezeichnung und Länge der Variablen
Variablenlabels
  • Verwendung von Labels, die Item- oder Fragenummer und den Variableninhalt enthalten sowie ob es sich um eine hergeleitete Variable handelt
Variablengruppen
  • Variablengruppen und korrespondierende Variablengruppenlisten im Kodebuch sind eine effektive Möglichkeit einen Datensatz zu organisieren, besonders wenn es sich um einen Datensatz mit einer großen Zahl an Variablen handelt
Kodes und Kodierungen
  • Kodes sollten von allen statistischen Software-Packages gelesen werden können und sollten die Vergleichbarkeit der Daten erhöhen. Richtlinien sind an verschiedenen Stellen verfügbar (bspw. ICPSR Guide S. 8-10).
Fehlende Werte
  • Sorgfältige Planung im Hinblick auf Methoden für die Identifizierung und den Umgang mit fehlenden Werten sollte die Forschung von Beginn an begleiten, um sicherzustellen, dass derartige Fragen in der Analyse thematisiert werden können.