Im Unterschied zur gesichtsbasierten Emotionserkennung verwendet die stimmbasierte Emotionserkennung zumeist ein dimensionales Ordnungssystem. Emotionen werden nicht einem bestimmten Typus zugeordnet, sondern anhand graduierbarer Merkmale in einem Koordinatensystem verortet. Zwei Hauptdimensionen einer solchen Einteilung bilden die Valenz (positiv – negativ) und der Erregungsgrad. Diese beiden Dimensionen lassen sich als orthogonale Achsen darstellen, um deren Schnittpunkt die Emotionen kreisförmig angeordnet sind.15 Jede Emotion wird durch einen bestimmten Vektor aus Valenz und Erregung dargestellt. Das Modell kann um weitere Dimensionen wie Dominanz ergänzt werden. Diese Dimension gibt an, wie viel Kontrolle oder Macht jemand in einer Situation ausübt.
Die stimmbasierte Analyse bezieht sich in erster Linie auf die Erregungsachse. Die Parameter lassen sich jedoch genauer ausdifferenzieren, etwa in Bezug auf Lautstärke, Tonhöhe oder Sprechgeschwindigkeit. So weist Ärger ein Muster mit gesteigerter Lautstärke und Tonhöhe auf, während bei Furcht die Tonhöhe und die Sprechgeschwindigkeit höher sind. Auch die Anzahl der Pausen sowie die Häufigkeit von Überschneidungen, die entstehen, wenn eine Person einer anderen ins Wort fällt, werden berücksichtigt.
Ein Anwendungsfeld der stimmbasierten Emotionsanalyse sind Call-Center. Dort sollen die Stimmen von Kunden und Call-Center-Mitarbeitern analysiert werden, um herauszufinden, wann eine Situation aus dem Ruder läuft. Mitarbeiter werden anhand solcher Aufnahmen gezielt darauf trainiert, anhand bestimmter Strategien mit diesen Situationen umzugehen und die Kunden zu einem erwünschten Verhalten zu bringen. Auch für Amazons persönlichen Assistenten Alexa gibt es seit 2019 eine stimmbasierte Emotionserkennungssoftware, die die Dimensionen Valenz, Erregung und Dominanz miteinander kombiniert.16 Ein künstliches neuronales Netz wurde hierfür mit Hilfe öffentlich zugänglicher Daten trainiert.
Einige Firmen haben Apps entwickelt, um an die entsprechenden Daten zu kommen. Eine der ersten war das Programm Moodies des israelischen Start-ups Beyond Verbal (später fusioniert zu Vocalis Health). Die für Apple- und Android-Geräte verfügbare App bringt Menschen dazu, die stimmbasierte Emotionserkennung spielerisch auszuprobieren. Dabei generieren sie Daten, um das System zu trainieren. Das Programm soll für über 25 Sprachen funktionieren, darunter Mandarin, Kantonesisch sowie Vietnamesisch. In der Coronakrise arbeitete Vocalis Health daran, anhand von Stimmanalyse Hinweise auf eine Infektion mit Covid-19 zu gewinnen.
Stimmbasierte Emotionserkennung wird zudem als Mittel für die Zuschreibung bestimmter Persönlichkeitsmerkmale eingesetzt. Die Produkte von Beyond Verbal beispielsweise sollten in der Lage sein, die Sprecher einem Persönlichkeitstyp zuzuordnen, der auf recht undurchsichtige und spekulative Art und Weise aus drei fundamentalen unbewussten Trieben und diversen neurophysiologischen Prozessen abgeleitet wurde.17 Die drei Grundtypen wurden S-, H-, und G-Typ genannt. Während der S-Typ (engl. survivalist ) sich latent bedroht fühlt und stets bereit ist, auf eine existentielle Bedrohung zu reagieren, ist der H-Typ (engl. homeostatist ) vorwiegend an Routine und der Aufrechterhaltung des Status quo orientiert, während der G-Typ (engl. growth ) an allem Möglichen interessiert ist und sich durch ein Streben nach persönlichem Wachstum auszeichnet.
Solche Zuschreibungen sollen etwa in Bewerbungsgesprächen eingesetzt werden. Und es ist klar, welcher Typus das Rennen machen würde. Auch die klassischen Big Five aus der Persönlichkeitspsychologie wurden (unter anderem gefördert von der deutschen Telekom) bereits im Zusammenhang mit der stimmbasierten Emotionsanalyse untersucht.18 Es handelt sich um die Charakterzüge: Offenheit für Erfahrungen, Gewissenhaftigkeit, Aufgeschlossenheit (Extroversion), Sozialverträglichkeit sowie emotionale Labilität und Verletzlichkeit (Neurotizismus).
Fast noch mehr als von gesichtsbasierten Verfahren verspricht man sich von der stimmbasierten Emotionserkennung einen unmittelbaren Zugang zu zentralen Aspekten des Innenlebens und der Persönlichkeit, der nicht der bewussten Kontrolle unterliegt. Allerdings bleiben auch im Hinblick auf die Zuverlässigkeit dieser Methode viele Fragen offen, etwa nach kulturell oder sprachlich bedingten Unterschieden oder dem Umgang mit Verstellung, Ironie oder Sarkasmus.
Während die stimmbasierte Emotionsanalyse von den gesprochenen Inhalten abstrahiert, konzentriert sich die Sentimentanalyse auf die Sprachbedeutung. Diese Technologie analysiert die Bedeutungsdimensionen sprachlicher Äußerungen, um die jeweilige Gefühlslage der Sprecher herauszufinden. Gegenstand der Analyse können Phrasen, Sätze oder ganze Dokumente sein.
Im Rahmen der Sentimentanalyse kommt der Valenz von sprachlichen Ausdrücken eine besondere Bedeutung zu. Valenz ist als Kategorie ebenso wie Erregung zwar zu undifferenziert, um bestimmte Emotionstypen eindeutig zuzuschreiben. Das Verfahren kann jedoch dafür eingesetzt werden, um herauszufinden, ob eine Zielgruppe einem Produkt, einer Marke, einer Dienstleistung, aber auch einer Institution oder politischen Partei positiv oder negativ gegenübersteht. Die Entwicklung der Stimmung an den Aktien- und Finanzmärkten sowie das Entstehen sozialer Unruhen oder Protestbewegungen im Rahmen der vorhersagenden Polizeiarbeit (engl. predictive policing ) stellen weitere Anwendungsbereiche dar. Auch die Identifikation potentieller Terroristen aufgrund ihrer Befindlichkeitsäußerungen in sozialen Netzwerken wird angestrebt.
Verwendet werden für die Sentimentanalyse lexikonbasierte Ansätze oder maschinelles Lernen. Die Grundlage lexikonbasierter Ansätze bilden Wörterbücher, in denen die Wörter einer Sprache als positiv oder negativ konnotiert eingeordnet werden. Hinzu können syntaktische Merkmale wie die Stellung eines Wortes im Satz oder die Verwendung von Superlativen kommen. Maschinelles Lernen verzichtet auf den Gebrauch von Wörterbüchern und trainiert künstliche Systeme mit Hilfe von Mustererkennung in einer bestimmten Datenmenge darauf, positive oder negative Äußerungen zu erkennen. Ein wichtiges Reservoir an Daten für die Sentimentanalyse bieten die sozialen Medien wie Facebook oder Twitter. Entsprechende Daten wurden etwa genutzt, um die Veränderungen der Gefühlslage im Lauf der Coronakrise zu untersuchen.
Über die sozialen Medien lassen sich Emotionen mit Hilfe von Sentimentanalyse nicht nur erkennen, sondern auch beeinflussen. So untersuchten einige Wissenschaftler der Cornell University in Kooperation mit Facebook die Verbreitung von Gefühlen über das soziale Netzwerk.19 Die Studie wurde zwischen dem 11. und 18. Januar 2012 durchgeführt und geriet stark in die Kritik, weil sie Einfluss auf die Gefühle der Nutzer nahm, ohne diese vorab zu informieren. In diesem Zeitraum wurden die Newsfeeds von knapp 700 000 Personen, die auf den englischen Facebookseiten eingeloggt waren, ohne deren Wissen manipuliert. Eine direkte emotionale Interaktion der Personen untereinander konnte ausgeschlossen werden.
Bei der einen Gruppe wurde die Anzahl der positiven Inhalte in ihrem Newsfeed reduziert. Dies führte dazu, dass diese auch weniger positive Posts absetzten. Bei der anderen Gruppe wurden die negativen Inhalte mit dem entgegengesetzten Effekt verringert. Das Resultat der Studie lautete, dass die im sozialen Netzwerk verbreiteten Emotionen die Gefühlslage der Nutzer entsprechend beeinflussen. Dies wurde als Beweis dafür gewertet, dass es eine massive emotionale Ansteckung über soziale Netzwerke allein über die Inhalte gibt, ohne andere Parameter des Emotionsausdrucks miteinzubeziehen.
Dadurch eröffnen sich weitreichende Möglichkeiten der politischen Einflussnahme. Politische Kampagnen nehmen sich Marketing- und Konsumentenanalysen zum Vorbild. Die Sentimentanalyse soll einen Einblick in Gefühle und Stimmungen sowie politischen Einstellungen in den sozialen Medien vermitteln. Die Zielgruppen werden dann durch gezielte Werbung und auf die Person zugeschnittene Botschaften angesprochen. In den Fokus der öffentlichen Wahrnehmung gerieten diese Praktiken besonders durch die dubiosen Aktivitäten der mittlerweile insolventen Firma Cambridge Analytica.
Читать дальше