Maschinelles Lernen

Online-Übersetzer lernen mehr Textverständnis

Web
03.04.2017 09:11

Wenn Maschinen Texte übersetzen, gehen sie meist Satz für Satz vor. Dabei stehen wichtige Informationen oft an anderer Stelle im Text. Schweizer Forscher verfolgen daher nun den Ansatz, Übersetzungsprogrammen mehr Textverständnis beizubringen.

Programme wie "Google Translate" verwenden Statistik, um die wahrscheinlichste Übersetzung von Wortgruppen in Sätzen zu liefern. Hinter menschlichen Übersetzerinnen liegen die Maschinen jedoch noch meilenweit zurück. Einer der Gründe: Die Algorithmen schauen nicht über die Grenzen eines Satzes hinaus. Dadurch haben sie etwa Mühe mit Pronomen, wie "sie" oder "diese", da das, worauf sie sich beziehen, in einem anderen Satz steht.

Forscher um Andrei Popescu-Belis vom Forschungsinstitut Idiap in Martigny wollen das im Rahmen eines vom Schweizerischen Nationalfonds SNF unterstützten Projekts ändern, indem sie den Algorithmus auch angrenzende Sätze analysieren lassen. Am Montag stellten sie ihre neuesten Ergebnisse bei einer Konferenz der "Association for Computational Linguistics" im spanischen Valencia vor.

Ein Beispiel, wie das "Satz für Satz"-Vorgehen von Übersetzungstools Probleme mit Pronomen verursacht: "Meine Tante hat eine tolle Limousine gekauft. Sie ist aber nicht so schön." Google Translate übersetzt dies so ins Englische: "My aunt has bought a great sedan. But she is not so beautiful." Der englischsprachige Leser liest also, dass die Tante nicht so schön sei, weil "sie" in Zusammenhang mit "schön" öfter mit "she" übersetzt wird als mit "it".

Solche Probleme bestehen insbesondere bei Übersetzungen zwischen Französisch und Englisch sowie Englisch und Spanisch. Programme wie Google Translate irren sich beim Übersetzen von Pronomen bei diesen Sprachpaaren in rund der Hälfte der Fälle. Das von Popescu-Belis' Team gemeinsam mit Kollegen von den Universitäten Genf, Zürich und Utrecht entwickelte Tool senkt diese Fehlerrate auf 30 Prozent.

Der Trick: Die Wissenschaftler brachten dem Übersetzungsalgorithmus mittels maschinellem Lernen bei, auch angrenzende Sätze zu berücksichtigen. "Im Prinzip geben wir dem System an, wie viele der voranstehenden Sätze es in welcher Weise analysieren muss. Dann testen wir es unter realen Bedingungen", sagte Popescu-Belis.

Noch sei die Technik zwar nicht ausgereift für die breite Anwendung, allerdings hat das Projekt schon die Aufmerksamkeit von Anbietern von Übersetzungsprogrammen auf sich gezogen. Das Forschungsteam sieht in der Lösung des Pronomen-Problems indes nur den Anfang. Mit der gleichen Idee, Maschinen mit mehr Textverständnis übersetzen zu lassen, wollen sie auch Aspekte wie die korrekte Abfolge der Zeiten oder die zum Kontext passende Terminologie verbessern.

 krone.at
krone.at
Loading...
00:00 / 00:00
play_arrow
close
expand_more
Loading...
replay_10
skip_previous
play_arrow
skip_next
forward_10
00:00
00:00
1.0x Geschwindigkeit
explore
Neue "Stories" entdecken
Beta
Loading
Kommentare

Da dieser Artikel älter als 18 Monate ist, ist zum jetzigen Zeitpunkt kein Kommentieren mehr möglich.

Wir laden Sie ein, bei einer aktuelleren themenrelevanten Story mitzudiskutieren: Themenübersicht.

Bei Fragen können Sie sich gern an das Community-Team per Mail an forum@krone.at wenden.



Kostenlose Spiele