Empirische Methoden kämpfen mit den gleichen Problemen, die generell mit der menschlichen Vernunft und der menschlichen Natur verbunden sind. Oder wie Kant es bereits sagte: Die Empirie erkennt das, was sie zuvor als Struktur und Fragestellung in das Phänomen hineingelegt hat.
6.3Methode oder Versuchspersonen: Wer liegt hier falsch?
Ich habe Nassim Taleb als Vertreter eines mathematisch-empirischen Ansatzes vorgestellt, der die Grenzen und die inhärenten Verzerrungen dieses Ansatzes unterschätzt ( Kap. 2.11).
Ich will das an einem weiteren Beispiel demonstrieren. Taleb schildert ein berühmtes psychologisches Experiment. Man bittet Versuchspersonen, etwas zu schätzen. Sie sollen einen Zahlenbereich so wählen, dass die zu schätzende Zahl sich mit einer Wahrscheinlichkeit von 98 Prozent im gewählten Zahlenbereich befindet. Den Zahlenbereich können sie frei wählen. Theoretisch müsste man erwarten, dass jeweils 98 Prozent der getesteten Personen einen Zahlenbereich angeben, in dem der gesuchte Wert enthalten ist. Bei einer vorgegebenen Fehlertoleranz von 2 Prozent sollten theoretisch also nur 2 von 100 Personen den tatsächlichen Wert verfehlen. Solche Experimente zeigen aber regelmäßig, dass der Prozentsatz von Personen, die danebenliegen, sehr viel höher ist. Das heißt, die Versuchspersonen gehen davon aus, dass sie einen Wertebereich angeben, der mit 98-prozentiger Wahrscheinlichkeit die tatsächliche Zahl trifft. In Wahrheit ist diese Wahrscheinlichkeit aber sehr viel geringer.
Taleb führt für diese Art von Experimenten beispielhaft folgende Anekdote an. Bei einem Vortrag bat er seine Zuhörer, zu schätzen, wie viele Bücher Umberto Eco in seiner Bibliothek hatte. Bei solchen Experimenten liegen immer – und so war es auch hier – sehr viele Personen daneben, obwohl sie selbst sicher sind, dass ihr Zahlenbereich die gesuchte Zahl enthält. In diesem Fall war es sogar so, dass keine Person einen Bereich nannte, der die tatsächliche Zahl von 30 000 Büchern einschloss. Manche langen viel zu tief und andere viel zu hoch. Manche gaben einen Wertebereich von 2000 bis 4000 an. Andere nannten einen Zahlenbereich von 300 000 bis 600 000 Büchern. [5, S. 176–177]
Es gibt zwei Schlussfolgerungen, die aus solchen Experimenten gezogen werden. Menschen überschätzen ihr Wissen. Anders ausgedrückt: Sie unterschätzen die Unsicherheit bzw. ihr Nichtwissen. Sie sind sich also zu 98 Prozent sicher, obwohl das Wissen im Schnitt nur zu einer zum Beispiel 50-prozentigen Trefferquote führt oder noch viel schlechter ausfällt. Die zweite Schlussfolgerung geht in die Richtung, dass Menschen schlecht darin sind, Vorhersagen zu treffen. Denn die Ausgangssituation des Experiments ist mit einer Situation vergleichbar, in der man aufgrund unvollständiger Informationen eine Prognose für die Zukunft treffen soll. Ob man etwas Vergangenes (zum Beispiel die Anzahl der Bücher in der Bibliothek von Umberto Eco) aufgrund eines nicht detaillierten Wissens schätzen oder ein zukünftiges Ereignis aufgrund ebenfalls unvollständigen Wissens einschätzen soll, ist eine ähnliche Ausgangslage. So ist es fast immer bei der Einschätzung komplexer zukünftiger Ereignisse. Man kennt nur einen Teil der maßgebenden Faktoren bzw. kann nicht genau sagen, welche Faktoren mit welcher Bedeutung für eine zukünftige Entwicklung zu werten sind.
Man kann aber nun einen fundamentalen Einwand gegen diese Experimente vorbringen. Die Versuche sind so aufgebaut, dass man das Ergebnis leicht und statistisch sauber auswerten kann. Die Teilnehmer erhalten eine präzise Zahl über die Wahrscheinlichkeit, wie zuverlässig sie ihre eigene Einschätzung bewerten sollen (98 Prozent). Das, was sie schätzen sollen, sind wiederum Zahlen. Es lässt sich also sehr einfach auswerten, ob eine Versuchsperson einen Treffer hatte oder nicht.
Wir haben bei den allgemeinen psychologischen Verzerrungen unseres Denkens gesehen, dass wir schlecht darin sind, intuitiv mit Zahlen und vor allem mit Statistiken umzugehen (vgl. Kap. 2.10). Das ist auch nicht überraschend. Denn Mathematik und der Umgang mit Zahlen sind in unserer evolutionären und über viele Hunderttausend Jahre dauernden Entwicklung ein recht modernes und erst sehr spät hinzugekommenes Phänomen. Die Urzeitmenschen beschäftigten sich nicht mit der Schätzung der Anzahl von Büchern, mit Wertebereichen, Statistik oder prozentualen Sicherheiten oder Unsicherheiten von Aussagen. Auch wenn wir heute viel mit Computern und Rechenmaschinen umgehen, funktioniert der menschliche Verstand nicht wie ein mathematisches Programm. Man könnte also sagen, dass die Versuchsanordnung unfair ist. Denn sie schafft künstliche Bedingungen. Die sind zwar optimal dafür geeignet, den Versuch später mit statistischen Methoden auszuwerten. Sie sind aber weit von einer praktischen Realität entfernt. Außer in einer Quiz-Show, in der diese Frage gestellt würde, wird es je kaum eine praktische Bedeutung haben zu wissen, wie viele Bücher Umberto Eco in seiner Bibliothek hatte. Deswegen sind solche Experimente schlecht geeignet, um die Qualität menschlicher Vorhersagefähigkeiten abzubilden. Die meisten Teilnehmer gingen wohl davon aus, dass Umberto Eco sehr viele Bücher in seiner Bibliothek hatte. Vermutlich dürften sie ihre Einschätzung darauf gestützt haben, dass er überhaupt eine Bibliothek besaß und dass sie ihn als Schriftsteller und Gelehrten kannten. Unter diesem Blickwinkel wollten sie zum Ausdruck bringen, dass es sich um überdurchschnittlich viele Bücher handeln müsse. Und damit hatten sie absolut recht. Für die einen bedeuteten überdurchschnittlich viele Bücher 2000 bis 4000, für andere 300 000 bis 600 000. Wenn man nun die hohen Fehlerquoten interpretiert, dann muss das gar nicht für schlechte Vorhersagefähigkeiten oder die Überschätzung des eigenen Wissens sprechen. Es könnte sich schlicht darum handeln, dass die eigentlich zutreffende globale Einschätzung (überdurchschnittlich viele Bücher) nicht gut in eine abstrakte mathematische Sprache übersetzt werden kann. Denn dass Menschen das intuitiv nicht gut können, ist alles andere als eine Überraschung.
Wiederum erkennt man hier ein Problem der empirisch-naturwissenschaftlichen und scheinbar objektiven Methode. Nicht selten sind die Ergebnisse der Versuchsanordnungen nichts anderes als das, was durch diese Versuchsanordnungen von Anfang an angelegt war.
6.4Irrtümer der Wissenschaft: Einige Beispiele
Nicht wenige Wissenschaftler sind blind gegenüber den Verzerrungsmechanismen, von denen die Naturwissenschaft genauso betroffen ist wie das »freihändige« Denken.
Einige weitere Schlaglichter:
John Ioannidis ist Professor an der Stanford Universität und ein Experte für die wissenschaftliche Auseinandersetzung mit Wissenschaft. Er schätzt, dass achtzig Prozent aller wissenschaftlichen Ergebnisse methodisch falsch sind. Ein wahrlich ernüchternder Wert. [23]
Vieles, was man in früheren Zeiten als wissenschaftlich unumstößliches Wissen angesehen hat, stellte sich später als falsch, grotesk oder gar verstörend heraus:
Im 18. Jahrhundert wurden mit Siegellack oder einem heißen Eisen Körperteile verbrannt, Patienten über Feuersbrünsten oder dem tobenden Meer hochgezogen oder mit Flaschenzügen aufgezogen und dann stundenlang hängen gelassen. [24]
Man spritzte kaltes Wasser in die Scheide, setzte Patienten Lehmkappen oder Eismützen auf oder kettete sie, bis zum Kinn im Wasser stehend, in einem Brunnen an. [25]
In der Psychochirurgie griff man zum Skalpell. Burckhardt behandelte Ende des 19. Jahrhunderts Halluzinationen dadurch, dass er chirurgisch äußere Gehirnschichten entfernte. [26] Bis in die 1950er-Jahre hinein durchtrennte man bei Eingriffen die weiße Substanz des Stirnhirns, um Gefühlsprozesse zu dämpfen. [27]
Читать дальше