Athanasios Chasiotis
Experiment
Das Experiment (lateinisch: experimentum für »Versuch«, »Probe«; engl. experiment) ist eine methodisch kontrollierte Vorgehensweise, die in allen empirischen Wissenschaftsdisziplinen eingesetzt wird, um aus Theorien abgeleitete Kausal hypothese n (»T bewirkt Y«) zu überprüfen. In einem Experiment liegt eine Situation vor, in der die unabhängige Variable (T), also die vermutete Ursache eines Phänomens, systematisch variiert wird und Veränderungen der abhängigen Variablen (Y) gemessen werden. Zu einem idealen experimentellen Versuchsaufbau gehören im einfachsten Fall drei Elemente: die Aufteilung in eine Experimental- (oder engl. Treatment-) Gruppe und eine Kontrollgruppe , die zufällige Aufteilung der Versuchsobjekte des Experiments auf diese beide Gruppen (sog. Randomisierung ) und das[115] kontrollierte Setzen des Treatments, also die Manipulation durch die Versuchsleiter. Ronald A. Fisher (1935) hat in seiner Abhandlung »The Design of Experiments« die wesentliche Grundlage für die statistische Behandlung von experimentell erhobenen Daten geschaffen. Wenn die genannten drei Voraussetzungen erfüllt sind, können, je nach Anzahl der Versuche bzw. Versuchspersonen, durch die Wahrscheinlichkeitstheorie abgesicherte Schlüsse gezogen werden.
Experimentelle Designs
Experimentelle Studien werden vor allem in den Naturwissenschaften, sehr häufig in der Psychologie und seltener in den empirischen Sozialwissenschaften eingesetzt. In den letzten Jahren hat sich das Experiment jedoch in der verhaltenswissenschaftlichen Ökonomik (behaviorial economics) als Methodik zur Datengenerierung verbreitet (Fehr/Gintis 2007). In der Soziologie werden experimentelle Designs vergleichsweise selten verwendet. Ein von Soziologen durchgeführtes Experiment stellt zum Beispiel die Studie von M. Salganik, P. Dodd und D. Watts (2006) dar, in der Ungleichheit und die Prognostizierbarkeit von Erfolg auf Märkten für kulturelle Güter untersucht wurden. Die Teilnehmer dieses Experiments sollten Musikdownloads unbekannter Bands bewerten, entweder mit (Treatmentgruppe) oder ohne Information (Kontrollgruppe) über die Bewertungen anderer. Ein wichtiges Ergebnis des Experiments war, dass vorhandene Information über Präferenzen anderer die Ungleichheit des Erfolgs deutlich erhöht. Der Vorzug eines methodisch kontrollierten Experiments gegenüber anderen Wegen, Daten zur Prüfung von Zusammenhängen zu erheben, liegt darin, die schwierige Aufgabe kausalen Schließens in idealtypischer Weise zu lösen. Voraussetzung ist allerdings, dass alle drei aufgeführten Elemente eines Experiments eingesetzt werden. Gegeben, dass die Randomisierung auf die Treatment- und Kontrollgruppe erfolgreich war und das Treatment nur durch die Versuchsleiter manipuliert wird, geht die Variation der abhängigen Variablen (Y) nur auf das Treatment (T) zurück und ein Kausalschluss »T bewirkt Y« wird möglich. Der Unterschied von Y (etwa im Mittelwert) zwischen beiden Gruppen wird Treatmenteffekt genannt. Sind einzelne Elemente eines Experiments nicht oder nur unvollständig gegeben, dann ist ein Kausalschluss nicht mehr zulässig.
Experimentelle Versuchsplänekönnen auch wesentlich komplexer ausfallen. So ist es oft von Interesse, durch Vergleiche von Vorher- und Nachhermessungen in Treatment- und Kontrollgruppen zeitliche Veränderungen zwischen t 1und t 2zu erfassen. Der Treatmenteffekt wird in solchen Fällen mittels der Differenz zwischen den Gruppen und den zwei Messzeitpunkten berechnet. Solche Designs sind angebracht, wenn man davon ausgeht, dass auch ohne Setzen eines Treatments messbare Veränderungen (z. B. Reifung, Lernen) stattfinden. Außerdem ist es möglich, dass man den Zweigruppenvergleich systematisch erweitert. So können mehrere Treatment-Gruppen miteinander verglichen werden, etwa wenn verschiedene Treatment-Stärken eingesetzt werden. In den berühmten Milgram-Experimenten zur Gehorsamkeit gegenüber Autoritäten wurde etwa die Distanz-Nähe-Beziehung zu den vermeintlichen Opfern variiert und hinsichtlich der gezeigten Reaktionen verglichen (Milgram 1963, 1974). Außerdem ist häufig von Interesse, mehrere Bedingungen (mehrere unabhängige Variable) zugleich systematisch zu variieren und dabei jeweils mehrere Ausprägungen von Treatments zu berücksichtigen. Man spricht dann von mehrfaktoriellen Designs, wobei hier häufig sog. Moderatoreffekte erforscht werden: Je nach Ausprägung einer Drittvariable Z fällt der Zusammenhang von T und Y anders aus. Beispielhaft sind etwa Studien zum sog. Stereotype-Threat zu erwähnen. Nach der Theorie des Stereotype-Threat ist die Aktivierung eines negativen Selbstbilds, das dann nachfolgend zur Leistungsverschlechterung in Testsituationen führt, von situationalen Faktoren (z. B. der konkreten Aufgabenstellung) abhängig (Aronson et al. 1999).
Qualitätskriterien
Qualitätskriterien der mittels Experiment gewonnenen Daten sind die interne und die externe Validität (oder Gültigkeit). Von interner Validitätspricht man, wenn die Randomisierung und das Setzen des Treatments durch die Versuchsleiter den Anforderungen entsprechend erfolgt. Die Zufallsaufteilung von Versuchsobjekten (in den Sozialwissenschaften: Probanden) ist deswegen elementar, weil nur so weitere, unkontrollierte Einflussfaktoren in ihrer Wirkung ausgeschaltet werden können. Man geht davon aus, dass durch die Randomisierung mögliche Störgrößen zufällig auf Treatment- und Kontrollgruppe [116]verteilt werden und sich in ihrer Wirkung aufheben. Damit dies wahrscheinlich wird, ist eine gewisse Mindestbesetzung beider Gruppen notwendig. Weiterhin kann die Setzung des Treatments misslingen oder beeinträchtigt werden. In diesem Fall ist die interne Validität nicht gegeben. Externe Validitätbezieht sich auf die Verallgemeinerbarkeit des Treatmenteffekts aus der experimentellen Situation, häufig in Laboren, auf nicht-experimentelle Situationen.
Ein allgemeines Problem experimenteller Forschung ist die mögliche Reaktivität der Erhebungssituation auf die Probanden. Sie reagieren nicht nur auf das gegebene Treatment, sondern unkontrolliert auf die Randbedingungen der Durchführung des Experiments. Bekannt sind etwa Versuchsleitereffekt e. Je nachdem, wer die Experimente durchführt, zeigen sich andere Resultate. Wenn Probanden oder Versuchsleiter über die Forschungshypothese Bescheid wissen oder nur meinen, Bescheid zu wissen, kann dies die Ergebnisse beeinflussen. Diesbezüglich werden Doppeltblindversuch e, bei denen weder Probanden noch Versuchsleiter wissen, wer in der Treatment- und wer in der Kontrollgruppe ist, empfohlen. Außerdem sind in vielen Experimenten die Probanden eine selektierte Gruppe, oftmals handelt es sich um Studierende. Selbst wenn man diese Probanden zufällig auf Treatment- und Kontrollgruppe verteilt, sind die Ergebnisse des Experiments hinsichtlich der Generalisierbarkeit oft stark beeinträchtigt.
Feld- und natürliche Experimente
Man kann neben Laborexperimenten auch sog. Feldexperimente durchführen, die in für die Versuchspersonen gewöhnlichen (Alltags-)Kontexten stattfinden. Bei Feldexperimenten wissen die Probanden in der Regel nicht, dass sie an Experimenten teilnehmen. In solchen Fällen sind Feldexperimente nicht reaktiv. In den letzten Jahren haben sich zur Aufdeckung von Diskriminierung sog. Audit-Studien und Korrespondenztests etabliert (Überblick bei Pager/ Sheperd 2008). Dabei variiert man in realen Bewerbungssituationen etwa in Anschreiben und Lebensläufen den ethnischen Hintergrund von Bewerbern und analysiert die Reaktionen der Adressaten. Hier stellt sich die Frage der externen Validität nicht, allerdings müssen die Forscher den erzielbaren Wissensfortschritt gegenüber ethischen Bedenken abwägen. Von Feldexperimenten, bei denen die Versuchsleiter in einer gewohnten Umgebung experimentelle Bedingungen herstellen, sind natürliche Experimentezu unterscheiden, bei denen ein exogenes (oft natürliches, nicht vorhersehbares) Ereignis eine Randomisierung in Treatment- und Kontrollgruppe bewirkt. Joshua Angrist und William Evans wollten beispielsweise die Auswirkungen eines dritten Kinds auf die Arbeitsmarktbeteiligung von Müttern untersuchen (1998). Sie betrachteten die Geschlechtermischung von Familien mit zwei Kindern als eine Art von Zufallsaufteilung, weil der Geschlechtermix nicht manipulierbar erscheint. Bei zwei gleichgeschlechtlichen Kindern ist die exogen (d. h. nicht durch Präferenzen oder Arbeitsmarktchancen) beeinflusste Wahrscheinlichkeit größer, ein drittes Kind zu bekommen, als bei Familien mit zwei gegengeschlechtlichen Kindern. Die Ergebnisse natürlicher Experimente müssen besonders sorgfältig daraufhin geprüft werden, ob die gewünschte Zufallsaufteilung nicht durch kaum zu bemerkende Selektionsprozesse unterlaufen wurde. In diesen Fällen wäre der Kausalschluss wiederum gefährdet.
Читать дальше