Übersetzung mit „Künstlicher Intelligenz“ – Wie funktioniert das eigentlich?
Es ist noch nicht lange her, da wurde über maschinelle Übersetzungen gerne gespottet. Es existierten sogar Radioformate, in denen ein Text maschinell hin- und zurückübersetzt und dann über das Ergebnis herzhaft gelacht wurde. Diese Zeiten sind inzwischen vorbei, maschinell angefertigte Übersetzungen haben inzwischen flächendeckend Einzug gehalten.
Für maschinelle Übersetzungen (MÜ) gibt es unterschiedliche Ansätze:
- Regelbasierte MÜ:
Mithilfe von mehr oder weniger gut funktionierenden Regelsätzen wird zuerst der zu übersetzende Text analysiert. Dann werden die enthaltenen Worte in der Zielsprache identifiziert und daraus schließlich die Übersetzung unter Beachtung von für diese Sprachkombination hinterlegten Regeln zusammengebaut.
Nun ist Sprache aber gerne komplex und zudem dynamisch, sodass je nach Sprachkombination teils extrem umfangreiche Regelwerke erforderlich sind, deren Vollständigkeit zudem nicht definiert ist. Der erforderliche Aufwand für solch eine Sisyphusarbeit verbunden mit überschaubar guten Ergebnissen triggerte die Suche nach erfolgreicheren Vorgehensweisen. - Auf statistischen Verfahren beruhende MÜ:
Sehr vereinfacht gesagt, werden auf Basis großer Textsammlungen (sogenannte Large-Language-Models, LLMs) Wörter und grammatische Formen in Ausgangs- und Zielsprache durch statistische Verfahren einander aufgrund ihrer Häufigkeit und gegenseitigen Nähe zugeordnet und somit Wörterbücher und Grammatikübertragungsregeln erzeugt. In Verbindung mit künstlichen neuronalen Netzen (NMT) werden Zusammenhänge zwischen Ausgangs- und Zielsprache erkannt und fortwährend verfeinert.- Der große Vorteil: Diese Algorithmen benötigen für ihr Funktionieren keinerlei Kenntnis der beteiligten Sprachen.
- Der große Nachteil: Es kann nicht nachvollzogen werden, wie eine Übersetzung zustande kam. Oder böse formuliert: Es wird nicht übersetzt, sondern die aus Sicht eines Algorithmus wahrscheinlichste Übersetzung ausgegeben.
Wie gut sind die Ergebnisse?
Will man den Inhalt eines Dokuments in fremder Sprache grob erfassen, sind KI-gestützte Übersetzungstools inzwischen oft eine große Hilfe. Je spezifischer der Inhalt des Dokuments und je wichtiger der Text ist, umso riskanter kann es sein, sich auf eine Übersetzung zu verlassen, die ausschließlich auf der Wahrscheinlichkeitsberechnung eines Algorithmus beruht. Kritisch wird es auch bei sprachlich gut formuliertem, aber inhaltlichem Nonsens, denn dieser ist oft nur schwer zu erkennen.
Follow us on LinkedIn