© JUNGE FREIHEIT Verlag GmbH & Co.  www.jungefreiheit.de    34/01 17. August 2001

 
Pankraz,
Bello und der Traum von der Übersetzermaschine

In Japan hat die Firma Tanaka, bisher vor allem Hersteller elektronischen Spielzeugs, einen „Hundegebell-Transformator“ vorgestellt. Verschiedene Arten des Hundegebells werden darin analysiert und in sofort phonetisch abrufbare Sätze aus menschlicher Sprache umgewandelt, zum Beispiel „Ich habe Hunger“ oder „Ich fühle mich einsam“. Wahrscheinlich ist das nichts weiter als eine ziemlich dubiose Spielerei, zielt aber trotzdem auf eine große Sehnsucht, von der viele Menschen erfüllt sind, nämlich auf den technischen Sprachumwandler in Taschenformat, der einem endlich das mühsame, zeitraubende Sprachenlernen erspart und sofortige perfekte sprachliche Kommunikation auch an fernsten Gestaden und in fremdesten Weltgegenden ermöglicht.

Ach, wie wäre das schön! Man möchte mit einem Japaner oder zum Beispiel einem Bodukuden sprechen, ohne deren Sprache zu können, und so drückt man einfach einen Knopf auf einem kleinen Gerät, das man um den Hals trägt, und schon ertönt das, was der Eingeborene sagt, in makellosem Deutsch. Und der Eingeborene drückt seinerseits auf den Kopf, und alles, was ich ihm sage, ertönt in makellosem Japanisch oder Bodukudisch.

Leider handelt es sich, wie uns Computertechniker versichern, um einen unerfüllbaren Wunschtraum. Trotz intensiver Bemühungen in speziell dafür eingerichteten Forschungsabteilungen (etwa bei Siemens in München) kommt man nicht recht voran, türmen sich Schwierigkeiten über Schwierigkeiten. Die herkömmliche Datenverarbeitung ist damit völlig überfordert. Sie hat es bisher lediglich zu taschenrechnerähnlichen sogenannten Slangkisten gebracht, in die ich, wenn ich mich im Ausland verständlich machen will und die Sprache nicht verstehe, gewisse deutsche Ausdrücke eintippen kann, und sie erscheinen dann in der betreffenden Landessprache - eine Art schlichtes elektronisches Wörterbuch.

Mehr ist möglicherweise gar nicht drin, gibt es doch schon in der jeweils eigenen Sprache kein technisches System, das einen von verschiedenen Sprechern gesprochenen Fließtext fehlerfrei interpretieren könnte. Im Fluß eines Satzes werden Wörter ja nicht isoliert gesprochen; ihre Lautform verschmilzt meistens mit dem vorausgehenden oder folgenden Wort, so daß zum Beispiel aus einem „und der“ lautlich ein „unter“ wird. Programmierer haben versucht, durch Analyse der Wahrscheinlichkeiten im grammatischen Zusammenhang eines Satzes die Mehrdeutigkeiten zu reduzieren, doch hatten sie dabei vergessen, daß Menschen gerade beim alltäglichen Sprechen stets ungrammatische oder grammatisch mehr oder weniger defekte Äußerungen von sich geben.

Wenn nun aber schon die Erkennung von Lautfolgen die größten Hindernisse bereitet, so erweist sich die Analyse der grammatischen Struktur der Sprache selbst durch den Computer als geradezu absurd schwierig. Denn der Computer kennt eben nur die grammatischen Formen (wenn er sie kennt), doch nicht die lebensweltlichen Situationen, in die sie eingebettet sind.

Wenn sich zwei Schreiner etwa über die Anfertigung einer neuen Tür unterhalten, ist aus der Situation heraus sofort deutlich, daß das „einbruchssichere Schloß“, von dem sie sprechen, weder ein Prunkgebäude noch ein Schloß in einem Jagdgewehr ist. Aber woher soll der Computer das wissen?

Und all solches Ungemach spielt sich, wie gesagt, noch ganz auf der Seite der eigenen Sprache ab. Der Prozeß des Übersetzens aus der einen in die andere Sprache kommt erst noch. Und da reicht es bei weitem nicht aus, Schlüsselwörter in Relation zueinander zu setzen; eine Übersetzung verlangt die komplette Bewahrung aller Bedeutungselemente, die im Originaltext angelegt sind, und das sind unendlich viele, selbst wenn man das zu übersetzende Material möglichst aus allen lebensweltlichen Konkretionen herauslöst und zu einer Idealmatrize gerinnen läßt. Mit simplen Linearübersetzungen ist es nie und nimmer getan.

Thomas Schneider, der Siemens-Professor in München, der seit zwanzig Jahren an Programmierhilfen für Übersetzersysteme arbeitet, hat einmal einige der Mißverständnisse, die durch Linearübersetzung entstehen, vorgeführt. Er speiste den Satz ein: „Zum Speichern häufig gebrauchter Texte wird ein Band verwendet.“ Auf englisch kam dabei daraus: „In the direction of numerous secondhand texts grows on ribbon spends“, was, wieder ins Deutsche rückübersetzt, folgenden Satz ergibt: „ In Richtung auf viele Texte aus zweiter Hand wächst auf Girlande gibt aus.“

Sobald Schneider das Wort „bestimmt“ einspeiste, wurden vom Computer stets die Wortklassen verwechselt, und es kam Unsinn heraus. „Bestimmt“ kann ja vieles bedeuten, es kann eine finite Verbform sein wie in dem Satz „Der Kanzler bestimmt die Richtlinien der Politik.“ Es kann ein Partizip sein: „Der Kanzler hat sie schon immer bestimmt.“ Oder ein Adjektiv: „Der Kanzler ist sehr bestimmt“. Oder ein Adverb: „Der Kanzler kommt bestimmt nicht.“ Gegen solche Vielfalt helfen auch die von einigen Programmierern vorgeschlagenen Mikroglossarien nicht, weil die nur eine einzige Wortklasse absuchen können, nicht aber kombinierte Wortklassen unterscheiden.

Um einen einzigen Satz hinreichend analysieren und übersetzen zu können, müßten sämtliche Interpretationsmöglichkeiten sämtlicher Elemente dieses Satzes strukturell beschrieben und sinnvoll aufeinander zugeordnet werden. Das wäre dann schon eine wahrscheinlich unlösbare Aufgabe, wenn natürliche Sprachen endliche Systeme wären. Aber es sind unendliche, elastische, sich ständig verändernde Systeme.

Der computerisierte, von jedem Laien zu gebrauchende Allroundübersetzer wird wohl eine Utopie bleiben. Seien wir also froh über Tanakas Hundegebell-Transformator, über den Bello uns unmißverständlich mitteilt, daß er einsam ist und Hunger hat.


 
Versenden
  Ausdrucken Probeabo bestellen