Doch obgleich Daten im Zeitalter der Digitalisierung sprudeln wie das viel beschworene »Öl des 21. Jahrhunderts«, ist noch lange nicht garantiert, dass sie auch nutzbar sind. Oftmals laufen wir Gefahr, in einem Ozean von nutzlosen Daten und deren Derivaten zu ertrinken: Daten, die aus nicht repräsentativen Erhebungen stammen; Kennzahlen und Visualisierungen, die eine scheinbare Sicherheit suggerieren, statt zum vernünftigen Umgang mit Unsicherheit zu motivieren; Analysen, die wahlweise dramatisieren oder verharmlosen, aber selten zwischen Fakten und Interpretationen differenzieren.
Gute Daten und die Kompetenz, mit ihrer Hilfe kluge Entscheidungen zu treffen, sind in einer globalisierten und digitalisierten Gesellschaft mit ihren hochkomplexen Herausforderungen unverzichtbar für nachhaltige Entwicklung und soziale Teilhabe. Um Daten in Steuerungswissen zu transformieren, müssen sie bereinigt, verknüpft, analysiert, kontextualisiert und interpretiert werden. Die dazu nötige Kompetenz ist das, was wir unter Data Literacy verstehen.
Veränderung der Bedeutung von Data Literacy
Das Arbeitspapier 37 des Hochschulforums Digitalisierung nennt Data Literacy eine »zentrale Kompetenz für die Digitalisierung und die globale Wissensgesellschaft in allen Sektoren und Disziplinen«.2 Dass ausgerechnet die Corona-Krise den Wert von Data Literacy so deutlich machen würde und so viele Menschen dafür begeistern würde, sich selbst an der Analyse von Daten zu versuchen, hätte sich wohl niemand träumen lassen. Auch wenn der Anlass ein unerfreulicher ist, so liegt hierin eine große Chance.
Gerade zu Beginn der Krise standen Datenexpert*innen vor einer großen Herausforderung. Von ihnen wurde erwartet, Zahlen zu analysieren und Prognosen daraus zu erstellen, aber die Corona-Fallzahlen waren dafür nicht geeignet, weil sie zu wenige Informationen enthielten, etwa über die mögliche Dunkelziffer. Der Knackpunkt war und ist, dass die Fallzahlen erheblich davon abhängen, wie getestet wird. Dies geschieht nach wie vor nicht einheitlich auf Grundlage einer repräsentativen Auswahl von Testpersonen, sondern nach regional wie international verschiedenen Strategien, die sich im Zeitverlauf auch noch verändert haben. Das hatte mit der Verfügbarkeit von Tests zu tun, war aber auch eine Kostenfrage. Die registrierten Fallzahlen erlauben somit keine belastbaren und zeitlich beziehungsweise räumlich vergleichbaren Aussagen über die Gesamtsituation.
Ein möglicher Weg der Stellungnahme als Experte wäre die ehrliche und transparente Kommunikation des Mangels an gesichertem Wissen. Aber das birgt die Gefahr, dass zahlreiche Rezipienten die Botschaft empfangen, dass die Modellrechnungen falsch sind (weil die Wahrscheinlichkeit, dass es genauso abläuft wie im Modell, praktisch null beträgt), und daraus ableiten, dass die empfohlenen Maßnahmen wie beispielsweise Ausgangsbeschränkungen dann auch falsch sein müssen (obwohl sie wahrscheinlich notwendig und richtig waren und sind).
Das ist ein großes ethisches Dilemma. Ist es besser, bei der Wahrheit zu bleiben und zu hoffen, dass Experten trotzdem geglaubt wird bei der Interpretation von Unsicherheit? Oder sollte man mehr Sicherheit suggerieren, um das Richtige zu erreichen, auch wenn man im strengen Sinne nicht »beweisen« kann, dass es richtig ist?
In einer Krisenphase wie der jetzigen, in der mit unvollständigen Daten Szenariorechnungen erstellt werden, ist Data Literacy eine Schlüsselkompetenz. Mit der zunehmenden Bedeutung von Datenkompetenzen in nahezu allen Disziplinen wächst und vereinheitlicht sich an deutschen Hochschulen die Auffassung davon, was unter Data Literacy zu verstehen ist. Bei der Beförderung eines solchen gemeinsamen Verständnisses setzt der Stifterverband seit knapp zwei Jahren nicht nur in Deutschland Maßstäbe durch viel beachtete Publikationen zur fächerübergreifenden Etablierung von Data Literacy Education. Im Zentrum steht der Data-Literacy-Kompetenzrahmen des Hochschulforums Digitalisierung, der in seiner aktuellen englischsprachigen Fassung den Forschungsstand für die internationale Lehre zugänglich macht.
Wenn Daten als Ausgangsbasis für Wissens- beziehungsweise Wertschöpfung und somit als Grundlage für bessere Entscheidungen verstanden werden, dann ist Data Literacy »das Cluster aller effizienten Verhaltensweisen und Einstellungen für die effektive Durchführung sämtlicher Prozessschritte zur Wertschöpfung beziehungsweise Entscheidungsfindung aus Daten.« 3 Dieser Prozess der Wissensschöpfung umfasst mehrere Schritte: (A) Datenkultur etablieren – (B) Daten bereitstellen – (C) Daten auswerten – (D) Ergebnisse interpretieren – (E) Daten interpretieren – (F) Handeln ableiten. Data Literacy ist weit mehr ein breites und tiefes Detailwissen über sich laufend verändernde Methoden und Technologien. Datenethik, Motivation und Werthaltung spielen eine zentrale Rolle, um zukünftig mit Daten erfolgreich und souverän umgehen zu können.
In der Corona-Krise zeigte sich deutlich das Risiko einer (zu) starken Fokussierung auf technische Aspekte der Datenanalyse. Mit teilweise äußerst komplexen Algorithmen wurden Fallzahlen aus den Monaten März, Mai und August zu Kurvenverläufen und Kennziffern verrechnet. Dass sich die Auswahlkriterien für die Stichprobenziehung, also die getesteten Bevölkerungsgruppen, laufend veränderten, fand praktisch keine Berücksichtigung. Eine Aufschlüsselung der durchgeführten und positiven Tests nach Anlass und Subgruppen sowie nach Testwiederholungen an denselben Personen blieb weitgehend aus. Die Ergebnisse der Datenanalysen wurden von zahlreichen Medien unmittelbar zu Trends mit teilweise täglichen Richtungswechseln erklärt und dabei mit einer Bedeutung aufgeladen, die in den Daten höchstens ansatzweise enthalten war. Dies im Blick zu behalten ist wesentliches Element des Interpretierens von Daten (nicht: Ergebnissen).
Data Literacy umfasst hier, dass genau verstanden werden muss, wie ein Datum entsteht und welcher räumliche, zeitliche und sachliche Bezug daraus resultiert, um die aufbereiteten Informationen zielgerichtet und handlungsleitend interpretieren zu können. Als im Mai 2020 die Debatte über regional unterschiedliche Lockerungsstrategien in Deutschland geführt wurde, sollten Kenngrößen wie die Reproduktionszahl R und die 7-Tage-Inzidenz dafür die Entscheidungsgrundlage liefern. Doch derartige Kenngrößen, die sich erst mit erheblichem Zeitverzug berechnen lassen und noch dazu auf Daten beruhen, die alles andere als präzise Aussagen erlauben, können Entscheidungen nicht im Voraus stützen. Sie liefern kein Steuerungswissen, sondern ähneln eher dem Autofahren mit Blick in den Rückspiegel. Solange die Straße gerade verläuft, mag das noch angehen, aber nicht, wenn die Straße – bildlich gesprochen – durch die ergriffenen Maßnahmen verändert wird.
Handlungs- und Steuerungswissen erfordert die Interpretation von Daten und ihre Einbindung in einen Kontext. Den Gedanken, dass Wissen aus Daten erst entsteht, formuliert die deutsche Bundesregierung in ihrem Eckpunktepapier zur Datenstrategie folgendermaßen: »Im digitalen Zeitalter sind Daten eine Schlüsselressource für gesellschaftlichen Wohlstand und Teilhabe, für eine prosperierende Wirtschaft und den Schutz von Umwelt und Klima, für den wissenschaftlichen Fortschritt und für staatliches Handeln. Die Fähigkeit, Daten verantwortungsvoll und selbstbestimmt zu nutzen, zu verknüpfen und auszuwerten, ist gleichermaßen Grundlage für technologische Innovation, für das Generieren von Wissen und für den gesellschaftlichen Zusammenhalt.« 4 Die Nähe dieser Formulierung zur hier verwendeten Definition von Data Literacy ist unverkennbar.
Haltung als Kompetenzdimension
In einer als lebensbedrohlich wahrgenommenen Krise verschieben sich Maßstäbe. Im Zusammenhang mit Daten wiegt das Schutzbedürfnis der Gesellschaft unter Umständen schwerer als das Recht auf informationelle Selbstbestimmung. Auch Grundregeln guter wissenschaftlicher Praxis geraten auf den Prüfstand. Dies gilt insbesondere dort, wo der bisherige Konsens – so er denn existiert – nicht kodifiziert ist, etwa weil die Chancen und Risiken neuer Technologien wie Big Data in Zusammenhang mit künstlicher Intelligenz bei weitem nicht erschöpfend verstanden sind. Selbst wenn sich alle darüber einig sind, dass es etwas wie Datenethik braucht, bleibt diffus, wie eine solche Datenethik im konkreten Fall zu operationalisieren sein könnte.
Читать дальше