Bei einer Demonstration am Redmonder Firmensitz führten Frank Soong und sein Team von Microsoft Research Asia, dem zweitgrößten Forschungslabor des Softwarekonzerns im chinesischen Peking, vergangene Woche vor, wie die simultane Sprachübersetzung funktioniert. Als "Versuchskaninchen" diente Soong dabei Microsoft-Forscher Rick Rashid, dessen Begrüßungsworte mittels der Software vom Englischen zunächst ins Spanische und anschließend in weitere Sprachen übersetzt wurden.
Wie die Hörproben auf der Website von "Technology Review" beweisen, übersetzte die Software Rashids Worte nicht bloß in eine neue, ihm bislang unbekannte Sprache, sondern ahmte dabei auch seine Stimme nach. Obwohl der synthetische Ursprung der Übersetzung nach wie vor auszumachen ist, klingt das finale Ergebnis bereits überraschend menschlich.
Allerdings bedarf es dafür einer gewissen Vorarbeit: Wie Soong dem Bericht nach erklärte, müsse das System erst an die Eigenheiten des Sprechers gewöhnt werden. Dieser Vorgang dauere etwa eine Stunde. Im Anschluss werde die gesprochene Sprache in Textform gebracht, maschinell übersetzt und zu guter Letzt mit Hilfe einer computergenerierten, an die Stimme des Originalsprechers angelehnten Stimme wieder ausgegeben.
Vielfältige Einsatzmöglichkeiten
Auf diese Weise könnten derzeit 26 Sprachen übersetzt werden. Davon sollen eines Tages nicht nur Reisende in fremden Ländern profitieren, sondern etwa auch Schüler, die eine neue Sprache erlernen wollen: Durch das Hören der eigenen Stimme in einer fremden Sprache sei es leichter, diese zu imitieren, so die Forscher. Möglich sei zudem ein Einsatz in Navigations-Lösungen, so Soong. So könnte eine Smartphone-App etwa fremde Verkehrszeichen in die eigene Sprache übersetzen.
Wie Shrikanth Narayanan, Professor an der University of Southern California in Los Angeles, gegenüber "Technology Review" betonte, bringe die Übersetzungsmethode einen weiteren Vorteil mit sich: Das Wort sei nur ein kleiner Teil dessen, was Menschen sagten. Stimme, Sprachfluss, Intonation oder auch Pausen während des Sprechens lieferten ebenso wichtige Informationen über das Gesagte und wie dieses zu interpretieren sei. Systeme, die dies berücksichtigten, könnten der Übersetzung mehr Gehalt und Bedeutung verleihen und die zwischenmenschliche Interaktion damit verlässlicher machen.
Bei Microsoft arbeitet man nun daran, die Software dahingehend zu verbessern. Ob und wann mit einer finalen Version für den Massenmarkt zu rechnen ist, ist derzeit nicht bekannt.
Kommentare
Da dieser Artikel älter als 18 Monate ist, ist zum jetzigen Zeitpunkt kein Kommentieren mehr möglich.
Wir laden Sie ein, bei einer aktuelleren themenrelevanten Story mitzudiskutieren: Themenübersicht.
Bei Fragen können Sie sich gern an das Community-Team per Mail an forum@krone.at wenden.