Bridging

Im ersten Teil dieses Beitrags wurde ein Beispiel (rund um die Konstruktion to suffice with) dazu genutzt, um ein spezielles Problem neuronaler maschineller Übersetzung zu erörtern. Die gelieferten Übersetzungen waren zwar nicht komplett falsch, konnten jedoch nicht die Aussage des Satzes so wiedergeben, wie man es von einem professionellen Übersetzer erwarten würde. Natürlich fällt es mir deswegen leicht, die Maschine zu kritisieren. Ich muss zunächst allerdings vor meiner eigenen Haustür kehren, denn ich muss zugeben: Weder ist das Englische meine Muttersprache, noch kannte ich diese spezifische Verwendung von to suffice with, bevor ich den besagten Text gelesen habe. Ich bin also kein Deut besser als unsere Probanden, mein persönlicher Datensatz scheint ebenfalls unvollständig oder verunreinigt zu sein. Dennoch war ich in der Lage, den Satz so zu verstehen, wie der Autor es wünscht. Scheinbar besitzt der Mensch eine Fähigkeit, die der Maschine zu diesem Zeitpunkt noch fehlt. Wie sonst wäre ich in der Lage, mein eigenes sprachliches Unvermögen zu kompensieren?

Eine einfache Antwort wäre: Das ergibt sich doch aus dem Kontext! Oder: Der Mensch hat halt ein Gehirn, die Maschine nicht. Diese werden allerdings dem Wunder maschineller Übersetzung nicht gerecht. Deshalb hier ein Versuch, den Sachverhalt auf sprachlich-kognitiver Ebene zu erläutern:

Grundsätzlich ergibt sich die Aussage des Satzes tatsächlich aus dem Kontext. In diesem Fall durch den zweiten Hauptsatz, denn der ist dank seiner Formulierung unmissverständlich. Da sind sich sogar unsere Probanden einig. Was dieser für einen Einfluss auf den ersten Hauptsatz hat, ließe sich zumindest theoretisch durch eine indirekte anaphorische Verbindung oder auch Bridging (Brückenannahme) erklären. Eine Anapher ist kurzgesagt ein Verweis eines Satzglieds auf ein zuvor erwähntes. Das beste Beispiel dafür sind Personal- oder Demonstrativpronomina, die auf Deutsch beispielsweise eine sehr präzise anaphorische Verbindung etablieren, da sie sowohl Numerus als auch Genus des Bezugsworts in sich tragen. Eine indirekte Anapher ist etwas abstrakter, denn sie beruht nicht auf grammatischen Regeln, sondern auf Weltwissen. Ein einfaches Beispiel zeigt den umgekehrten Fall, in dem ein vorangegangenes Glied ein später folgendes verdeutlicht:

Brexit-Votum im Unterhaus: Gelassenheit in Brüssel

Das Wort Brexit im ersten Teil aktiviert den Teil unseres Weltwissens rund um den Austritt Großbritanniens aus der EU. Darauf basierend interpretieren wir das Wort Brüssel im zweiten Teil im Rahmen eines uns bekannten Schemas. Dieses Schema diktiert sehr wahrscheinlich auch ihre Wahrnehmung der beiden folgenden legitimen Paraphrase desselben Satzes:

Brexit-Votum im Unterhaus: EU-Parlament gerät nicht in Panik

Brexit-Votum im Unterhaus: Die Ruhe der belgischen Hauptstädter

Durch Bridging filtern wir also selbst die richtige Übersetzung oder Paraphrase heraus. Dasselbe gilt für unseren eigentlichen Beispielsatz. Eine mir nicht bekannte Konstruktion hindert mich zunächst daran festzustellen, in welchem Abhängigkeitsverhältnis Maschine-zu-Maschine-Anwendung und SIM-Karten stehen. Da dasselbe Abhängigkeitsverhältnis im zweiten Teil des Satzes jedoch eindeutig definiert wird und mein Weltwissen die Parallelen beider Beispiele erkennt, kann ich den ersten Teil rückwirkend verstehen. Und als ob das noch nicht genug wäre, habe ich obendrein selbständig meinen eigenen Algorithmus verbessert, in dem ich mir die Verwendung von to suffice with angeeignet habe.

NMT-Modelle können durchaus mit Kontext umgehen, z. B. durch die Einbindung spezifischer TMs oder qualitativ hochwertiger Sprachkorpora. Eine derart komplexe Kontextualisierung ist jedoch noch Zukunftsmusik, denn dafür bedarf es einer künstlichen Intelligenz, die in Sachen Kognition und Rekursion der des Menschen ebenbürtig ist.

Ein Ausblick

Diese zwei Hürden reihen sich ein in eine lange Liste zu bewältigender Aufgaben in der Entwicklung menschenähnlicher NMT-Modelle. Allerdings soll der maschinellen Übersetzung hiermit nicht ihr Potential abgesprochen werden. Denn so abstrakt und kleinteilig das hier beschriebene Beispiel auch sein mag – Ich persönlich zweifele nicht daran, dass diese Hürden eines Tages überwunden werden. Wann das ist, darüber erlaube ich mir kein Urteil. Bis dahin werden die wenigsten Übersetzungsvorgänge ohne menschliche Hilfe auskommen, sei es in der Revision oder in der Instandhaltung bestehender NMT-Modelle. Der Mensch hat also zunächst noch das letzte Wort in Sachen Übersetzung, ganz zu schweigen von Lokalisierung. Falls Sie für Ihre Übersetzungen oder Lokalisierungsprojekte noch die richtigen Menschen suchen, helfen wir hier bei text&form gerne bei der Vermittlung.

(Für all diejenigen, die den lehrreichen Artikel in der von uns gelieferten Übersetzung gelesen und abgeglichen haben: Ja, der Satz wurde schlussendlich stilistisch angepasst und nicht originalgetreu übersetzt. Stil und subjektiver Geschmack im Kontext maschineller Übersetzung ist allerdings ein so umfangreiches Feld, dass in diesem Artikel schlicht kein Platz mehr dafür bleibt.)

Über den Autor:

Daniel Nad, Project Manager at text&form

Eine geregelte Aneinanderreihung von Lauten, konserviert in abstrakten Zeichenfolgen mit tausenden, untereinander unverständlichen Varianten: Die menschliche Sprache ist faszinierend. Zumindest behauptet das unser Autor Daniel Nad. Als passionierter Sprachwissenschaftler und Mitarbeiter bei text&form erlebt er Sprache direkt – und freut sich, seine Passion mit anderen teilen zu können.

Bridging & NMT – Teil 2

Bridging

Ein Ausblick