Um dies anhand eines Beispiels zu veranschaulichen, käme ein solches, lineares Modell zu einem Score-Wert von 75, wenn die Tatsache, dass die zu bewertende Person männlich ist 10 Punkte wiegt, das Alter zwischen 35-40 ebenfalls mit 10 Punkten bewertet wird, die Herkunftsregion 30 Punkte zählt und der Ausbildungsgrad mit weiteren 25 Punkten in die Rechnung einbezogen wird. Neben diesem vereinfachten Modell können mittels Machine Learning auch komplexere Modelle aufgestellt werden, die auf einer zuvor selbstständig entwickelten Regel basieren. Das Ergebnis dieser Regel beinhaltet dann bereits die einzelnen Gewichtungen und könnte lauten, dass jemand der männlich ist, zwischen 35-40 Jahren alt ist, aus einer bestimmten Region stammt und einen gewissen Ausbildungsgrad hat, eine Wahrscheinlichkeit von 75 % aufweist, demnächst ein neues Auto zu kaufen.143
VII. Bedeutung von Machine Learning
Das Neuartige an heutigen Vorhersagetechniken ist im Gegensatz zu den aufgezeigten einfachen Modellen, dass diese mittels Machine Learning-Modellen automatisch und zum Teil auf selbstlernender Basis entwickelt werden können. Machine Learning ist ein „Forschungsbereich, der Computern die Fähigkeit gibt zu lernen, ohne explizit programmiert zu werden.“144 Aufgrund der automatisch ablaufenden Prozesse wird auch davon gesprochen, dass Machine Learning die Fähigkeit besitzt, das Erkennen von Zusammenhängen zu erlernen.145 Diese Metapher soll jedoch nicht den Anschein erwecken, dass es sich bei dieser Lernfähigkeit um eine der menschlichen Eigenschaft vergleichbare Kompetenz handelt. Der Lerneffekt innerhalb des Machine Learnings ist eher im funktionalen Sinne zu verstehen.146 Dabei sind zwei Arten von Machine Learning zu unterscheiden: Im Rahmen des sog. supervised Machine Learning werden dem Algorithmus zunächst Beispiele eines bestimmten Phänomens vorgegeben. Eine Veranschaulichung dieser Methode liefert die Vorgehensweise bei der automatischen Erkennung von Spam-Emails.147 Durch die Vorauswahl des Email-Empfängers, der bestimmte Emails als Spam kennzeichnet, kann der Algorithmus anhand dieser vorgegebenen Beispiele ein Muster erkennen. Die Entwicklung dieses Musters geschah deshalb nicht vollends selbstständig, sondern wurde durch die Vorgaben des Nutzers angeleitet („supervised“). Darüber hinaus können Machine Learning-Algorithmen aber auch ohne explizite Vorgaben Muster in Daten erkennen. Diese weiterentwickelte Form des Machine Learnings ist heute keine Ausnahme mehr. Durch das Analysieren neuer Datensätze „lernt“ der Algorithmus neue Zusammenhänge und wandelt diese Erkenntnisse in neue Muster und Modelle um. Das Besondere an der Entwicklung von Predictive Models durch Machine Learning ist gerade diese automatische Fortentwicklung. Das ursprüngliche Modell wird durch die ständige Angleichung an neue Erkenntnisse immer weiter perfektioniert. Der Prozess ist erst dann abgeschlossen, wenn das Modell eine Antwort auf die gesuchte Fragestellung liefert. Dieser Automatismus ist der entscheidende Punkt, weshalb die am Ende des Prozesses stehende Predictive Analytic auf der einen Seite so undurchdringlich für den Einzelnen, auf der anderen Seite so vielversprechend für den Verwender sein soll.
VIII. Predictive Analytic im eigentlichen Sinne
Die dargestellten vorangehenden Prozesse münden in die eigentliche Predictive Analytic in Gestalt einer Vorhersage. Mithilfe des durch ein Predictive Model erstellten Score-Wertes lässt sich eine Vorhersage darüber aufstellen, wie wahrscheinlich ein bestimmtes Verhalten eines Einzelnen ist.148 Ein Beispiel für eine mögliche Fragestellung kann die Vorhersage der Kündigungsbereitschaft eines Kunden sein. Dabei bedarf es einer Ausgangsfrage in Form einer Hypothese. In diesem Beispiel würde diese lauten: „Der Kunde ist kündigungsbereit.“ In der Folge wird versucht, diese Ausgangshypothese, die sog. Nullhypothese, zu widerlegen. Mögliche Alternativen zur Nullhypothese werden demgemäß als Alternativhypothesen bezeichnet. Um eine Einteilung der Ergebnisse in eine wahrscheinliche und eine weniger wahrscheinliche Kategorie vorzunehmen, müssen Grenzwerte vergeben werden, bei deren Überschreiten die zugrunde liegende Hypothese als zutreffend oder widerlegt eingeordnet wird. Die Ergebnisse können in zweierlei Kategorien ausgedrückt werden: metrisch149 oder binär. Bei allgemeinen Klassifizierungen, wie im Falle logistischer Regression, werden die Variablen binär erklärt. Das bedeutet, dass es immer nur zwei Ausprägungen gibt.150 Beispiele hierfür sind: ja/nein, kaufbereit/nicht kaufbereit, kündigungsbereit/nicht kündigungsbereit, krank/nicht krank, etc. Der ersten Alternative wird beispielsweise die Zahl 1, der zweiten die Zahl 0 zugeordnet. Zudem muss ein Grenzwert bestimmt werden, der festlegt, ab welchem Wahrscheinlichkeitswert welche Kategorie greift. Wird der Grenzwert beispielsweise bei 0,5 festgesetzt, bestätigen alle Vorhersagen mit einem Wert > 0,5 die Nullhypothese, alle Werte < 0,5 sprechen für die Widerlegung der These. Durch diese Vorgehensweise wird die Hypothese – und damit der ihr zugrunde liegende Sachverhalt – als eher wahrscheinlich oder eher unwahrscheinlich eingeordnet. Diese Wahrscheinlichkeitsaussage ist die Predictive Analytic im eigentlichen Sinne.
109S. Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 110Hildebrand, ISreport 2006, 17. 111Weichert, ZRP 2014, 168, 169. 112Meffert, So wird aus Big Data Smart Data, 7.6.2017, http://www.bigdata-insider.de/so-wirdaus-big-data-smart-data-a-604998/, zuletzt abgerufen am 27.6.2018. 113Thon/Nes, edpl 2017, 16. 114So können bsp. Daten aus Flugdatenbanken entnommen werden. Deren Nutzung läuft laut Wiebe, K&R 2014, 239 auch nicht der normalen Auswertung der Datenbank zuwider. 115Weichert, ZD 2013, 251, 252. 116Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 117Matzer, So verhilft Customer Intelligence zu zufriedeneren Kunden, 12.6.2017, http://www.bigdata-insider.de/so-verhilft-customer-intelligence-zu-zufriedeneren-kunden-a-612405/, zuletzt abgerufen am 27.6.2018. 118Bezogen auf Scoring-Verfahren allgemein Roßnagel, ZD 2013, 562, 562. 119S. Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 6. 120Iffert, Controlling & Management Review, Sonderheft 1/2016, 16, 17. 121Zur möglichen Reanonymisierung von personenbezogenen Daten hat bereits das BVerfG, 15.12.1983 – 1 BvR 209/83, BVerfGE 65, 1, Rn. 110 – Volkszählungsurteil, Stellung genommen. Es ging bereits davon aus, dass „scheinbar undurchbrechbare Anonymisierungen mit einfachen mathematischen Verfahren wieder repersonalisiert werden können“. 122So aber die implizierte Definition von Predictive Analytic bei Schulz, in: Gola, Datenschutz-Grundverordnung, 2017, Art. 6 Rn. 197. 123S. die dahingehende Untersuchung der Datenschutzaspekte bei Crawford/Schultz, 55 Boston College Law Review 93, 1, 4. 124S. hierzu bereits unter B. IV. 3. a) bb). 125S. die Ausführungen in Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 5. 126Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 5. 127S. z.B. auf der Cloud Plattform von SAP, Cloud Plattform, abrufbar unter https://www.sap.com/germany/products/cloud-platform.html, zuletzt abgerufen am 27.6.2018. 128Zu cloudbasierten Services s. Iffert, Controlling & Management Review, Sonderheft 1/2016, 16, 22. 129S. die In-Memory-Lösung SAP HANA, abrufbar unter https://www.sap.com/germany/products/hana.html., zuletzt abgerufen am 27.6.2018; sowie von IBM, BLU Acceleration Solution – Power Systems Edition, abrufbar unter http://www.ibm.com/systems/power/solutions/bigdata-analytics/editions/db2-blu.html, zuletzt abgerufen am 27.6.2018; ebenfalls Oracle, Database In-Memory, abrufbar unter https://www.oracle.com/de/database/database-in-memory/index.html, zuletzt abgerufen am 27.6.2018. 130S. zur Datenstruktur bereits unter C. I. 6. 131Vgl. Markl, in: Hoeren, Big Data und Recht, 2014, S. 9, wonach unstrukturierte Daten wie Text- , Bild-, Audio- oder Videodateien zuerst vorverarbeitet werden müssen. 132S. z.B. die Unified Data Architecture Software des Anbieters teradata, Teradata – Big Data and Advanced Analytics Teradata, abrufbar unter http://www.teradata.com/products-and-services/analytics-from-aster-overview, zuletzt abgerufen am 27.6.2018. 133S. das Angebot der Alteryx GmbH, Whitepaper: 6 Schritte zu schnellerem Data Blending für Tableau, 7.6.2017, S. 6, abrufbar unter http://www.bigdata-insider.de/data-blending-mit-koepfchen-v-38294-12529/?cmp=nl-ta-wp-lead-Alteryx-20170616, zuletzt abgerufen am 27.6.2018, die ein Data Blending (Datenverschmelzung) anbietet, das die Daten von verschiedensten Quellen miteinander verknüpft, bereinigt und anschließend analysiert. 134Rouse, Whatsl.com, Extract, Transform, Load (ETL), abrufbar unter http://www.searchenterprisesoftware.de/definition/Extract-Transform-Load-ETL, zuletzt abgerufen am 27.6.2018. 135S. Claßen, So orchestrieren Sie den Machine Learning Workflow, 28.7.2017, abrufbar unter https://www.bigdata-insider.de/so-orchestrieren-sie-den-machine-learning-workflow-a-618118/, zuletzt abgerufen am 27.6.2018. 136Vgl. hierzu: Koeffer, Mit Predictive Analytics in die Zukunft blicken, 17.4.2014, http://www.derwesten.de/wirtschaft/digital/mit-predictive-analytics-in-die-zukunft-blicken-id9252539.html, zuletzt abgerufen am 27.6.2018. 137Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 138Eine frühe Form fortschrittlicher Mustererkennung aus einer größeren Menge an selbst dokumentierten Daten stellt die im Jahr 1932 von den Anthropologie Professoren Driver und Kroeber aus Berkeley veröffentlichte, quantitative Darstellung von Klassifizierungen kultureller Beziehungen dar. S. hierzu Kroeber, American Anthropologist 1935, 539. 139Das Modell erfasst den Zyklus eines Data Mining-Prozesses in sechs Phasen, s. grundlegend http://crisp-dm.eu/home/about-crisp-dm/, zuletzt abgerufen am 27.6.2018. 140S. hierzu sogleich unter VII. Zum Zusammenhang zwischen Data Mining und Machine Learning s. Fraunhofer Institut für sichere Informationstechnologie, Begleitpapier Bürgerdialog Chancen durch Big Data und die Frage des Privatsphärenschutzes, 2015, S. 24. 141Siegel, Predictive Analytics: the power to predict who will click, buy, lie, or die, 2013, S. 26. 142S. hierzu sogleich unter VIII. 143Anlehnung der Beispiele an die in Siegel, Predictive Analytics: the power to predict who will click, buy, lie, or die, 2013, S. 26 genannten Berechnungsmethoden. 144Eine Auseinandersetzung mit den unterschiedlichen Definitionen von Machine Learning findet sich bei Puget, What Is Machine Learning?, 18.5.2016, abrufbar unter https://www.ibm.com/developerworks/community/blogs/jfp/entry/What_Is_Machine_Learning, zuletzt abgerufen am 27.6.2018. 145Fraunhofer Institut für sichere Informationstechnologie, Begleitpapier Bürgerdialog Chancen durch Big Data und die Frage des Privatsphärenschutzes, 2015, S. 24. 146Surden, 89 Washington Law Review Rev. 87, 1, 2 (2014). 147Ausführlich beschreibt dieses Beispiel Surden, 89 Washington Law Review Rev. 87, 1, 2-4 (2014). 148Vorhersagen ohne Bezug zu einer Einzelperson werden im Folgenden ausgeklammert. 149Eine metrische Einordnung erfolgt in Form eines genauen Wertes, z.B. in kg, l, m oder einer sonstigen Maßeinheit. 150Wagner, INWT Statistics, Logistische Regression – Modell und Grundlagen, 15.7.2015, https://www.inwt-statistics.de/blog-artikel-lesen/Logistische_Regression.html, zuletzt abgerufen am 27.6.2018.
Читать дальше