Titelfoto: spacejunkie/photocase
Sprachtechnologie

Der Computer soll auch zwischen den Zeilen lesen

Spitzfindiger Spott lässt den Rechner kalt: Der Computer versteht keine Ironie. Michael Wiegand und sein Team bringen ihm bei, Meinungen, Stimmungen und Gefühle aus dem, was wir sagen, herauszulesen. Mit Forschern aus Hildesheim wollen die Sprachtechnologen dazu beitragen, dass der Rechner nicht von vornherein an Wortwitz scheitert.
Von Claudia Ehrlich • 10.11.2015

Schrecklich, schön, super – hinter diesen Wörtern steckt mehr: eine Wertung. Und überaus doppeldeutig können die Begriffe außerdem sein: Schrecklich gut! Ganz schön schwer! Das hat ja super geklappt! – wenn in Wahrheit alles schiefgelaufen ist. Sollen Computer heute verstehen, was hier zwischen den Zeilen steht, sind sie raus. Fangfragen, Wortspiel, Ironie, mit denen Menschen Meinung oder Gefühl rüberbringen, werden für den Rechner zum Stolperstein. Das weiß jeder, der seinem Handy oder Navi gegenüber schon mal einen ironischen Ton angeschlagen hat. Auch der verständigste Computer bleibt da ungerührt oder läuft auf Error. „Wörter und linguistische Regeln zu kennen, ist eben nicht genug, um hinter den Sinn zu schauen. Hier setzen wir an: Wir wollen dem Computer die fehlende Information geben, damit er Meinungen in Texten automatisch identifizieren und analysieren kann“, sagt Michael Wiegand. Der promovierte Computerlinguist forscht an der Saar-Uni am Lehrstuhl für Sprach- und Signalverarbeitung von Professor Dietrich Klakow.

„Wir arbeiten mit den Sprachen Englisch und Deutsch. Im Deutschen besteht großer Bedarf, weil auf diesem Gebiet noch kaum etwas existiert. Im Englischen gibt es bereits Ergebnisse, die wir ergänzen wollen“, sagt Wiegand. So gewann Supercomputer Watson 2011 im US-Fernsehquiz Jeopardy gegen menschliche Gegner auch bei Fragen, bei denen quergedacht werden musste. Beim Quizlösen half Watson übrigens eine Computerlinguistin der Saar-Uni. „Aber davon, Meinung oder gar Ironie zu erkennen, ist Watson noch weit entfernt“, sagt Wiegand.

Foto (Wiegand): Claudia Ehrlich

Wir geben dem Computer die fehlende Information, damit er Meinungen in Texten automatisch identifizieren kann.

Bislang setzt die Forschung hierbei vor allem auf große Textmengen: Analyseprogramme zählen Wörter, die mehr verraten. Je nachdem wie oft „schlecht“ oder „traurig“ vorkommen, schätzt der Rechner, ob es im Text eher positiv oder negativ zugeht. Wiegand und seine Kollegen dagegen betreten Neuland. „Wir schauen auf den einzelnen Satz und die Wörter und bestimmen, wer im Text etwas sagt, das mit Meinung zu tun hat“, erklärt er. So ermitteln sie Informationen, die hinter den Wörtern und Sätzen stecken, und übersetzen diese für den Computer so, dass er sie erkennen und verarbeiten kann. „Wir erstellen zuerst von Hand eine Textsammlung und schreiben den Wörtern ihre Bedeutungen zu, hinterlegen also etwa dem Wort ´dumm`, dass es wertend gemeint sein kann. Diesen Vorgang automatisieren wir“, erläutert Wiegand. Um zu prüfen, ob der Computer von selbst den Sinn richtig erfasst, vergleichen sie seine Ergebnisse mit der von Hand erfassten Textsammlung.

An dieser Arbeit sind auch Studenten und Doktoranden beteiligt wie Marc Schulder: Er erforscht in seiner Doktorarbeit, wie Computer die Bedeutung von Sprache verarbeiten. „Ich durchleuchte in diesem Projekt Wörter daraufhin, wie und warum sich ihre Bedeutung dreht, sie also verwendet werden, um etwas ganz anderes auszudrücken, wie bei ´ganz schön schlimm`. Es ist bei weitem nicht nur die Verneinung, die diesen Effekt bewirkt. Wir wollen herausfinden, bei welchen Wörtern das so ist und wie das von statten geht“, erklärt Marc Schulder. „Es ist ein sehr schönes Thema, gerade weil wir hier an den Grundlagen arbeiten.“

„Unsere Ergebnisse wollen wir als Ressource, also als eine Art Wörterbuch für künftige Forschung zur Verfügung stellen“, sagt Michael Wiegand. Die Arbeit wird von der Deutschen Forschungsgemeinschaft mit 500.000 Euro gefördert, die Hälfte davon fließt an sein Team. Und wer weiß: Vielleicht antwortet das Navi demnächst auf ein genervtes „Na super, jetzt bin ich falsch“ dank der Saarbrücker Forscher: „Ich habe vollstes Verständnis für Ihre Ironie!“

Im Englischen kann jedes

7. Wort

verwendet werden, um eine Verneinung auszudrücken.

Foto (Schulder): privat

Ich durchleuchte Wörter daraufhin, wie und warum sich ihre Bedeutung dreht.

Quellennachweis
  • Bilder
    Titelfoto: spacejunkie/photocase

    Foto (Wiegand): Claudia Ehrlich

    Foto (Schulder): privat