|
Dokumentation
Die Erstellung einer qualitativ hochwertigen Datendokumentation kann eine sehr zeit- und ressourcenintensive Angelegenheit sein. Dieser Bereich skizziert die idealen Bestandteile einer klaren und verständlichen Dokumentation für quantitative und qualitative Daten. Weitere Empfehlungen finden sich bspw. im UK Data Archive Folder ESDS data management guides oder im ICPSR Guide(S. 13-16).
Dokumentation in strukturierten Formaten
CESSDA Archive raten NutzerInnen sich an den Metadaten-Dokumentationsstandards der Data Documentation Initiative (DDI) zu orientieren. Diese sind Standards für Inhalt, Darstellung, Übermittlung und Bewahrung der Dokumentation in den Sozialwissenschaften und gewinnen zusehends internationale Anerkennung und Bedeutung. Sie ermöglichen mittels der universellen Mark-up Sprache XML die inhaltliche und technische Organisation von Daten und Metadaten in einer einheitlichen und unkomplizierten Art und Weise. Bestimmte quantitative Rechenschritte können mittels DDI auch direkt durchgeführt und im Web dargestellt werden.
Mehr Informationen zu DDI sowie eine Liste an Tools und anderen XML Ressourcen sind auf der Homepage der Data Documentation Initiative verfügbar, auf den ESDS Metadaten-Seiten sowie selbstverständlich bei WISDOM.
Sollte es im Rahmen eines Forschungsprojektes nicht möglich sein, eine Dokumentation im DDI Format zu erstellen, so sollte ein einheitliches, strukturiertes Format gewählt werden, das es dem Archiv ermöglicht, die Metadaten schnell und einfach in XML zu konvertieren. In den meisten Fällen gewinnen Datenarchive die DDI Einträge aus den von den PrimärforscherInnen zur Verfügung gestellten Informationen und Dokumentationen.
Mindestmaß an Information
Eine gute Datendokumentation ist ein wesentlicher Bestandteil eines Datensatzes und es gibt ein Mindestmaß an Informationen, welche gewährleisten, dass die Daten für ForscherInnen sinnvoll sekundär nutzbar werden. Drei Arten von Informationen sollten zur Verfügung gestellt werden: beschreibende Informationen, Kontextinformationen und Kataloginformationen.
Beschreibende Informationen
Beschreibende Informationen sind notwendig für den sachkundigen Umgang mit einem Datensatz. Ein Großteil dieser Informationen lässt sich aus bereits vorhandenen Berichten, Arbeitspapieren und Publikationen ableiten.
- Informationen über Datenerhebungsmethoden: Hier sollte der Datenerhebungsprozess beschrieben werden, ob es sich nun um Fragebogenerhebung, Transkriptionsverfahren, Interviewverlauf oder nicht reaktive Verfahren (Protokolle, Aufzeichnungen, etc.) handelt. Auch die verwendete Erhebungsmethode sowie eine Begründung für die Methodenwahl bzw. die Methodenentwicklung sollten dargestellt werden. Weiters sollten auch Informationen über das Stichprobendesign und die Stichprobenmethode zugänglich gemacht werden. Auch Informationen über Pilotprojekte, Pretests oder Kontrollmaßnahmen zur Qualitätssicherung sind von Interesse sowie Informationen über die zeitliche und geographische Einbettung des Datensatzes, die verwendete Software bei der Datenerhebung, die gespeicherten Formate und eine Liste der zum Datensatz gehörigen Dateien.
- Informationen über die Datenstruktur: Dazu gehören Informationen über die einzelnen Files des Datensatzes und wie diese miteinander in Beziehung stehen sowie Fallzahlen und die Zahl der Variablen im Datensatz:
- Bei relationalen Datenbanken soll ein Diagramm die Struktur der Datenbank, die Relationen und Elemente anzeigen (z.B. Entity-Relationship-Modell)
- Bei qualitativen Daten sollen die Beziehungen zwischen den Interviews und Beobachtungen dargestellt werden.
- Bei der Verwendung eines Mehrmethoden Designs, z.B. einer Umfrage und vertiefenden qualitativen Interviews soll die Beziehung dargelegt werden.
- Technische Informationen
- Variablen und Werte, Kodes- und Klassifikationsschemata. Für numerische Daten sollten eine vollständige Variablenliste- und Beschreibung sowie alle Details zu Klassifikationen und Kodes zur Verfügung gestellt werden. Es ist hilfreich, Variablen zu identifizieren, auf die Standardklassifizierungen angewendet werden können (bspw. NACE, ISCO-88, etc.) sowie durch bibliographische Referenz festzuhalten, um welche Version es sich handelt. Für qualitative Daten sollten für jedes Interview/ jede Beobachtung, etc. ebenfalls Informationen erstellt werden, die Details zu Hintergrund- und Kontext enthalten.
- Informationen zu abgeleiteten Variablen. Abgeleitete Variablen können im einfachen Fall bspw. neu gewonnene Altersgruppierungen aus bestehenden Daten sein, bei komplexeren Fällen handelt es sich um Algorithmen. In jedem Fall sollte die Ableitung nachvollziehbar dokumentiert werden. Bei einfachen Fällen genügt der Variablenname bzw. das Label als Auskunft, bei komplexeren Fällen sollten die Befehls-Statements zur Generierung der abgeleiteten Variablen, z.B. SPSS oder Stata syntax erfasst werden. Kann die Befehlssprache von SekundärnutzerInnen nur schwer nachvollzogen werden, sollten die Ableitungen zusätzlich beschrieben werden.
- Gewichten und Hochrechnen. Gewichtungs- und Hochrechnungsprozeduren von Variablen sollten in jedem Fall vollständig dokumentiert werden. Des Weiteren sollten Anleitungen zur Verwendung dieser integriert werden.
- Datenherkunft. Details zur Herkunft der Daten sollten dokumentiert werden. Wenn Daten aus vorhandenen und archivierten Quellen verwendet werden, sollte die Herkunft der Materialien dargelegt werden.
- Vertraulichkeit und Anonymisierung. Es ist von Bedeutung festzuhalten, ob die Daten vertrauliche persönliche, haushaltsbezogene oder organisationelle Informationen enthalten. Derartige Informationen sollten vor einer Datenabgabe an ein Archiv entfernt oder anonymisiert werden. Wo die vertraulichen Informationen für eine Sekundäranalyse erforderlich sind, sollten spezielle Übereinkünfte und Zugangsregelungen mit dem Archiv getroffen werden.
- Validierung und andere Kontrollen. Außerdem sollten alle bekannten Datenfehler und durchgeführten Kontroll- und Bereinigungsverfahren die während der Datensammlungsüberprüfung vollzogen wurden, dokumentiert werden. Im Falle von qualitativen Daten ist es hilfreich zu wissen, ob Transkriptions- und Qualitätskontrollen durchgeführt wurden. Für Daten, die mittels technischer Prozesse gewonnen werden, gelten geringfügig andere Voraussetzungen. Hier bedeutet Validierung die Überwachung der technischen Abläufe und Transkriptionsfehler. Verifizierung hingegen meint die Überprüfung der Daten durch Experten oder Stichprobenvergleiche.
Kontextinformationen
Informationen über den Kontext, in dem Daten erhoben wurden und über die Verwendung der Daten.
- Beschreibung des ursprünglichen Projekts. Dazu gehören Informationen über die Entstehungsgeschichte eines Projekts, die geistigen, finanziellen und organisatorischen Hintergründe und Entwicklungen im zeitlichen Verlauf. Z.B. den Zweck und die Ziele des Vorhabens, daraus entstandene Publikationen, entwickelte Maßnahmen und andere relevante Kontextinformationen.
- Ursprung des Datensatzes
- Wiederholte Erhebungen und Zeitserien, neue Versionen. Für fortlaufende Querschnittserhebungen, Panels oder Zeitserien sollte die Dokumentation zusätzliche Informationen über Veränderungen der Variablen, Fragentexte, Labels oder Stichprobenverfahren beinhalten.
Kataloginformationen
Kataloginformationen ermöglichen es dem Archiv einen Datenkatalog oder Studienbeschreibung zu erstellen. Die Studienbeschreibung dient zwei Zwecken. Erstens einer bibliographischen Erfassung des Datensatzes für die notwendige Anerkennung und eine sachgemäße Zitation. Zweitens ist die Studienbeschreibung notwendig zur Suche und Erkundung der Datenressourcen. Ein formeller Katalogeintrag wird von Archiven für jede archivierte Studie angelegt. Dazu gehören Informationen über Titel des Datensatzes, PrimärforscherInnen, FördergeberInnen, DatenerheberInnen, Datum der Datenerhebung, zeitliche und geographische Abdeckung, Methoden der Datenerhebung, Stichprobendesign- und Rahmen. Diese Informationen werden vom Datenarchiv bei der Übergabe der Daten mittels eines Datenbeschreibungsformulars (quantitativ, qualitativ) erhoben. Für weitere Details bezüglich strukturierter Kataloginformationen oder Studienbeschreibungen siehe WISDOM Metadaten Dokumentation.
Zusätzliche Informationen:
- Wo vorhanden eine Kopie der Datenerhebungsinstrumente (Fragebogen, Leitfaden, etc.) erläutert mit Variablennamen und abgeleiteten Variablen, eine Kopie der InterviewerInnenanweisungen und ein Ablaufschema des Erhebungsinstruments. Für komplexere Fragebögen kann es sinnvoll sein, eine graphische Darstellung zur Verfügung zu stellen, die Aufschluss darüber gibt, welchen Befragten welche Fragen gestellt wurden und wie verschiedene Items zusammen hängen. Das ist besonders nützlich, wenn kein Ausdruck des Fragebogens vorliegt.
- Indizes und Verzeichnisse erstellen. Gerade für große Datensätze ist dies essentiell. Eine Liste mit Variablennamen in alphabetischer Reihenfolge und mit Verweisen zu detaillierten Variablenbeschreibungen kann sehr hilfreich sein.
- Abkürzungsverzeichnisse und Listen über andere Konventionen. Sowohl Variablennamen als auch Labels enthalten Abkürzungen. Idealerweise sollten diese standardisiert sein.
- Umkodierungsbeschreibungen. Es ist von Bedeutung ein Protokoll über die einzelnen Schritte zur Rekodierung von Variablen zu führen. Diese Information wird manchmal in einem gesonderten Dokument zur Verfügung gestellt.
- Kodieranweisungen. Regeln und Definitionen zum Kodieren der Daten sind hilfreich für die Datenanalyse.
- Alle Berichte und Publikationen, die zusätzliche Informationen beinhalten.
Qualitative Datendokumentation
Die Anforderungen an eine Dokumentation qualitativer Daten sind den oben genannten Vorgaben sehr ähnlich. Dennoch gibt es spezifische Besonderheiten. Die wichtigsten Eckpunkte sollen kurz dargestellt werden. Für Weitere Informationen kontaktieren Sie WISDOM.
Die Dokumentation von qualitativen Daten liefert einen Kontext für die Daten und das Forschungsvorhaben. Wenn detailliert genug, kann die Dokumentation helfen, SekundärnutzerInnen, die nicht direkt in die Datenerhebung involviert waren, ein besseres Verständnis des Forschungsprozesses zu geben.
Übliche Elemente einer Dokumentation umfassen:
- Forschungsdesign oder Projektantrag
- Endbericht
- Beschreibung der verwendeten Methodologie
- Interviewleitfaden
- Fragebogen
- Beobachtungsleitfaden
- InterviewerInnenanweisungen
- Kommunikation zu Fragen der Vertraulichkeit mit Befragten
- Einverständniserklärungen der Befragten
- Baumdiagramme
- Informationen zu verwendetem Equipment (Aufnahmegeräte, etc.)
- Andere Hintergrundinformationen
- Details zu fehlenden Informationen
- Schriftwechsel
- Aufbereitetes Material bspw. in QDA Software (Sprechermarkierungen, Kodes, Verweise im Transkript auf Audiomaterial, etc.)
- Verweise auf Berichte und Publikationen auf Basis der empirischen Daten
Obwohl der Umfang von Informationen von Datensatz zu Datensatz variieren kann, werden DatengeberInnen dazu angehalten, soviel Information wie möglich zur Verfügung zu stellen. Das Datenarchiv nutzt diese Informationen um SekundärnutzerInnen eine standardisierte Dokumentation oder Benutzungsanleitung anzubieten.
|
|