Innovation

5

02 Februar 2018

Stimmungsanalyse: Was für einen Menschen normal ist, ist für den Algorithmus perfekt

30 Prozent aller Menschen nehmen Stimmungen unterschiedlich wahr

Jeder weiß, dass es ziemlich kompliziert ist, die Stimmung oder Tonalität von Inhalten, die User in Social Media, Foren, Blogs oder auf Meinungsseiten posten, zu analysieren. Tatsächlich kann ein und derselbe Begriff, abhängig von seinem Kontext, zwei unterschiedliche Bedeutungen haben. Oder sogar komplett entgegengesetzte Stimmungen vermitteln. Noch komplexer und schwieriger als eine solche Mehrdeutigkeit wird für es für ein Programm, Ironie, Übertreibungen, Sarkasmus, eine zweite Ebene oder … britischen Humor zu erfassen.

Zudem entwickelt sich jede lebende Sprache permanent weiter. Was vor 18 Monaten ein Trendbegriff oder angesagter Ausdruck gewesen sein mag, kann heute längst überholt sein.

Die Technologie und das Programm sind das eine. Der Mensch ist das Andere. Bei einer Stimmungsanalyse ist der Mensch zunächst entscheidend: Er ordnet die Ergebnisse der Auswertung ein. Er bestimmt, ob das Programm die Tonalität eines Begriffs richtig als „positiv“, „negativ“ oder „neutral“ erfasst hat und hilft, künftige Lernfehler zu vermeiden. Der selbstlernende Algorithmus, der der automatischen Auswertung zugrunde liegt, soll schließlich die richtigen Zuordnungen immer präziser erfassen.

In 70 Prozent der Fälle schätzen zwei Menschen die Tonalität eines Begriffes oder Ausdrucks gleich ein. Mag dieser Wert für die Übereinstimmungen bei Menschen als „normal“ gelten, wäre es für ein Programm geradezu „perfekt“, aus einem Korpus von Wörtern 70 Prozent Übereinstimmung zu erfassen. Denn bis heute gibt es keine unumstößlichen Kriterien, mit denen Tonalität und Stimmungen von Programmen und Algorithmen so eindeutig zu bestimmen wären.

Übersetzung: „Ich bin CEO, aber ebenfalls nur ein Sterblicher“

Stimmungsanalyse (mit der Möglichkeit, eine neutrale Tonalität auszuschließen)

Stimmungsanalyse: Große Fortschritte bei NLP und TALN

Das Natural Language Processing (NLP) und das Automatic Processing of Natural Language (TALN) haben in letzter Zeit enorme Fortschritte gemacht. Diese beiden sind die wichtigsten Disziplinen im maschinellen Lernen und in der Künstlichen Intelligenz. Sie ermöglichen Programmen erst, menschliche Sprache zu verstehen. So haben die Forschungs- und Entwicklungsteams von Linkfluence in einem hohen Ausmaß von den neuesten Ergebnissen auf dem Gebiet der NLP-Forschung an der ETH Zürich, an der Harvard University und von Facebook Research profitiert. Linkfluence nutzt diese Ergebnisse zur Optimierung seiner eigenen Algorithmen für die Stimmungsanalyse in seiner Software Suite Radarly.

Wichtigstes Ergebnis für die Arbeit von Linkfluence: „Natural Language Unterstanding“-Systeme (NLU) helfen, die linguistische Struktur einer Sprache zu entschlüsseln und die funktionale Rolle jedes einzelnen Wortes im Satz zu bestimmen. Die neueste Version der Algorithmen in unserer Stimmungsanalyse fußt genau darauf. Das Programm wertet automatisch den Inhalt eines Satzes aus und klassifiziert diesen dann nach der Tonalität als „positiv“, „negativ“ oder „neutral“. Es ordnet jeden Begriff nach seiner Funktion ein und bestimmt die syntaktischen Beziehungen zwischen den Wörtern eines Satzes. Diese syntaktischen Beziehungen stehen in direktem Zusammenhang mit der Bedeutung des untersuchten Satzes. So können dessen Bedeutung und damit die Tonalität und Stimmung besser eingeordnet werden.

Drei renommierte Forschungseinrichtungen, deren Erkenntnisse die F&E-Teams bei Linkfluence inspirierten, die Features der Stimmungsanalyse zu optimieren.

Entscheidende Faktoren für eine funktionierende Stimmungsanalyse: Kontext- und Sprachverständnis

Dank unserer Expertise im „Deep Learning“ macht Linkfluence rasche Fortschritte in der Optimierung der Stimmungsanalyse. Unsere Radarly-Plattform ist inzwischen in der Lage, den Kontext jedes Wortes sowie die Wortart und die Wechselwirkungen zwischen beiden zu analysieren. Außerdem können wir die Art des Wort-Kontextes erfassen.

Technische Exzellenz und der Zugriff auf die neuesten Forschungsergebnisse sind das Eine. Das Zusammenspiel von Mensch und Maschine ist der andere wesentliche Erfolgsfaktor: Linkfluence profitiert vom profunden Knowhow der Linguisten im Team. Unsere Experten sind in den europäischen ebenso wie in orientalischen Sprachen mit ihren häufig komplexen Schreibweisen und der teils umgekehrten Leserichtung oder in den Sprachen Asiens versiert. Linkfluence verfügt in letzteren über die weltweit einzige SaaS-Lösung, die ein breites Spektrum an Sprachen versteht: vereinfachtes Chinesisch, traditionelles Chinesisch, Thai, Koreanisch, Japanisch und andere.

Posting auf SinaWeibo in vereinfachtem Chinesisch

Big Data und Deep Learning, wichtige Erfolgsfaktoren für die Stimmungsanalyse

Für die effiziente Arbeit eines NLP-basierten Programms muss ein sehr großer Datensatz nutzbar sein. Je umfangreicher dieser ist, desto besser ist das Training des selbstlernenden Algorithmus‘. Das heißt demnach: Je größer der Datensatz, desto weniger Verzerrung und präzisere Ergebnisse. Der Algorithmus ist kontinuierlich besser in der Lage, valide zu verallgemeinern. Mit 200 Millionen Posts und Konversationen täglich verfügt unser Algorithmus über eine enorme Menge an „Futter“ – und damit über eine sehr große und konsistente Trainings-Datenbasis.

Ein weiterer, entscheidender Punkt, der bei einer Stimmungsanalyse berücksichtigt werden muss: Menschen passen ihren Sprachstil dem verwendeten Medium an. Konversationen auf Instagram etwa haben einen anderen Stil, Duktus und eine andere Bedeutung wie Konversationen in Blogs. Es ist entscheidend, dass Algorithmen diese Nuancen ebenfalls erfassen und einordnen können. Eine speziell auf Twitter oder Facebook bezogene Social-Media-Analyse-Plattform wäre nicht übertragbar und nur wenig aussagefähig in Bezug auf anderen Medien oder Kanäle. Die 300 Millionen Quellen, die Linkfluence regelmäßig auswertet, sind also eine wahre Fundgrube für unsere Algorithmen, die die Bedeutungsnuancen und Feinheiten der Konversationen in verschiedensten Kanälen im Social Web erfassen und einordnen können.

Eine Stimmungsanalyse ist mehr als Tonalität

Die Stimmungsanalyse beschränkt sich nicht allein darauf, ausschließlich die Tonalität zu erfassen. Ein selbstlernender Algorithmus kann in einem bestimmten Kontext sämtliche Schlüsselwörter mit positiver Tonalität, die die User verwenden, herausfiltern. So können die Linkfluence-Experten ermitteln, welche Bedeutung und vor allem auch welchen Wert diese für die untersuchte Marke haben. Die so genannte „Affect Cloud“ ermöglicht, sämtliche Begriffe mit einer grundsätzlich positiven Bedeutung für eine Marke zu visualisieren – ebenso wie solche, die eher negativ konnotiert sind.

Der Algorithmus ordnet eine Tonalität (Grün: positiv, Rot: negativ) dem semantischen Kontext zu, in dem das Wort in einem Post steht.

Diese neuen, wichtigen Erkenntnisse in NLP und NLU ermöglichten die Einführung eines neuen innovativen Features in unserer Stimmungsanalyse. Diese neuen Funktionen bieten erst die Möglichkeiten, die für eine Marke wichtigen Themen umfassend einzuschätzen und als „positiv“, „negativ“ oder „neutral“ einzuordnen. Das heißt, dass das Programm definiert, ob ein Begriff in einem bestimmten Kontext üblicherweise eine eher positive, negative oder neutrale Tonalität hat.

Zwar ist der Mensch immer noch der Goldstandard, wenn es um die Bestimmung der Tonalität eines Satzes geht, doch die sich stetig weiterentwickelnde Technologie im Bereich der Stimmungsanalyse (auch Sentimentanalyse genannt) ermöglicht es den Maschinen immer näher an die Präzision des Menschen heranzukommen. Es wird spannend sein zu sehen, welche weiteren Innovationen im Bereich der Stimmungsanalyse uns in diesem und in den nächsten Jahren erwarten werden.

WEITERE ARTIKEL LESEN

Entdecken Sie noch mehr rund um Ihre Marke