Ihre Einführung in die maschinelle Übersetzung für Unternehmen

Lee Densmer 15. Jan. 2021
Ihre Einführung in die maschinelle Übersetzung für Unternehmen
Wenn auch Ihr Unter­nehmen, wie viele andere im digitalen Zeit­alter, immer mehr und immer schneller Content er­stellen und ver­walten muss, Ihr Budget für Lo­kalisierungen aber nicht mit­wächst, dann könnte maschinelle Über­setzung (MT) eine Lösung für Sie sein. Um Unternehmen den Ein­stieg in die MT zu er­leichtern, haben wir kürz­lich ein Webinar an­geboten, in dem Patrick Beßler, Machine Translation Engineer bei RWS Moravia, die Ge­schichte von MT sowie An­wendungs­fälle für Unter­nehmen vor­gestellt und erste Schritte er­läutert hat. Hier eine Zu­sammenfassung seiner Präsentation.

Ein Blick in die Geschichte

Bei maschineller Über­setzung, einem der ältesten Teil­bereiche von künst­licher Intelligenz (der bis in die 1950er Jahre zurück­reicht), werden Texte mit­hilfe von Soft­ware aus einer Sprache in eine andere über­setzt. Als die Technologie ein­geführt wurde, war sich die Wissen­schaft sicher, dass die an­fänglichen Pro­bleme binnen weniger Jahre be­seitigt sein dürften. 70 Jahre später ist MT jedoch ein noch immer an­dauerndes Experiment, das in den letzten Jahren zwar einige be­achtens­werte Fort­schritte und Innovationen hervor­gebracht hat, dennoch hat diese Technologie noch einen weiten Weg vor sich. Eine der signifikantesten Än­derungen in der MT war der Wechsel von regel­basierten zu statistischen Modellen. Regel­basierte MT, bei der linguistische Regeln für die Über­setzung aus einer Sprache in eine andere auf­gestellt werden, kommt heute noch immer in manchen An­wendungen zum Einsatz. Seit den späten 1980er Jahren jedoch werden meist statistische MT-Modelle ein­gesetzt. Der größte Vor­teil war die Senkung der Kosten. Statistische MT nutzt moderne CPU-Ressourcen besser aus und er­möglicht Skalen­effekte, da derselbe Algorithmus – im Gegen­satz zu regel­basierten Modellen – für das Trainieren vieler Sprachpaare ver­wendet werden kann. Aller­dings kommen statistische Modelle hin­sichtlich der Qualität, konkret des Sprach­flusses, irgendwann an ihre Grenzen. Eine jüngere Unter­kategorie der sta­tistischen Modelle ist die neuronale maschinelle Über­setzung (NMT), die auf den­selben Grund­konzepten beruht, jedoch die neuronalen Netze des mensch­lichen Ge­hirns nachahmt. NMT nutzt das größere Leistungs­potenzial moderner Com­puter noch besser aus und er­möglicht da­durch eine bessere lin­guistische Qualität. In NMT-Modelle können auch Deep-Learning-Techniken in­tegriert werden, um bessere und schnellere Über­setzungen im Ver­gleich zu her­kömmlichen statistischen Modellen zu er­zielen. Derzeit gelten sie als neuester Stand der Technik in Sachen MT für Unter­nehmen und werden von Tech-Giganten wie Google und Microsoft ein­gesetzt. Anzumerken ist hier jedoch, dass NMT höhere Kosten mit sich bringt. Dies ist der höheren Computer­leistung ge­schuldet, die dazu er­forderlich ist.

Welchen Unternehmensanwendungen nützt MT?

Im Allgemeinen fällt das Argument für MT in Übersetzungs­projekten mit großen Content-Volumina unter dem Gesichts­punkt des Return on Investment (ROI) am stärksten aus. Das gilt vor allem bei Content, der nützlich ist, aber nicht die Priorität hat, um die Kosten einer voll­ständigen Human-Übersetzung zu recht­fertigen. Dazu zählt beispiels­weise die Über­setzung von Kunden­feedback. Der Einsatz von MT hat auch Vor­teile, wenn es auf die Ge­schwindigkeit an­kommt, die Kosten niedrig ge­halten werden müssen oder der wachsende Über­setzungs­bedarf ein festes Budget übersteigt. Ein weiterer Einsatz­bereich für die maschinelle Über­setzung ist die mehr­sprachige Übersetzung interner Kommunikation unter Mit­arbeitern und/oder An­wendern eine Self-Service-Lösung. Community-Foren oder die Kommunikation in inter­national tätigen Unter­nehmen sind typische Bei­spiele. Zu guter Letzt kann MT auch als Komponente in einen größeren Service-Workflow integriert werden, z. B. in einer mehr­sprachigen Sentiment­analyse oder bei der Echt­zeit­übersetzung von ge­sprochener Sprache (Speech-to-Speech Translation, kurz S2ST oder SST). Es gibt also viele Einsatz­gebiete für MT, sogar für Marketing­texte, die früher als zu komplex galten, als dass sie auto­matisch über­setzt werden könnten. Schließlich ist Marketing­material stark auf die Marke aus­gerichtet und soll eine nuancierte Botschaft vermitteln.

Welche Vorteile bringt MT?

Der größte Vorteil von maschineller Über­setzung für Unter­nehmen ist eine höhere Pro­duktivität, wodurch sich die Markt­einführungs­zeit ver­kürzen, das Budget ein­halten und steigende Volumina besser be­wältigen lassen. Besonders in größeren, inter­national tätigen Unter­nehmen mit enormen Mengen an Content, den es zu über­setzen gilt, kann ein einziges robustes MT-System mehreren Übersetzungs­zwecken dienen – von interner Kommunikation über Blog­beiträge bis hin zu Community-Foren. Außerdem kann ein gut ein­gerichtetes MT-System Tipp­fehler oder Buchstaben­dreher ver­meiden, die das mensch­liche Auge schnell über­sieht. Zusätzlich werden die Texte all­gemein konsistenter.

Welche Faktoren sind bei der Wahl eines MT-Services zu berücksichtigen?

Qualitätsanforderungen

Maschinelle Übersetzung ist offen­sichtlich für die unter­schiedlichsten Szenarien ge­eignet und die Ziel­text­qualität kann ebenso stark variieren wie der Kontext. Die Qualität steigt dabei in direkter Proportion zur Qualität und zum Umfang der Trainings­daten, die in das System ein­fließen. Darüber hinaus haben Qualität, Einheit­lichkeit und Kom­plexität des Ausgangs­textes einen direkten Ein­fluss auf die Zieltext­qualität. So kann das Fehlen von Akronymen oder um­gangs­sprachlichen Wendungen in den Trainings­daten zu schlechteren Über­setzungs­ergebnissen führen. Es ist wichtig, zwischen Budget- und Zeitvorgaben und der ge­wünschten Qualität und Nuancierung ab­zuwägen. Wenn es beispiels­weise nur darum geht, die Kern­aussage eines Textes zu ver­stehen, dann ist eine Über­setzung mit einer MT-Lösung wahr­scheinlich ein­facher und das ge­wünschte Qualitäts­niveau leichter zu er­reichen. Bei Texten jedoch, die auf eine starke emotionale Wirkung ab­zielen, wie bei Vertriebs- oder Marketing-Content, ist eine spe­zialisiertere Engine nötig, da es hier viel stärker auf Nuancen ankommt, die eine größere Heraus­forderung darstellen.

Sprachliche Unterschiede

Was auch be­rücksichtigt werden muss, ist der Um­stand, dass nicht alle Sprachen oder Sprach­paare gleich auf­gebaut sind. Während bei Über­setzungen zwischen Nieder­ländisch und Englisch im Allgemeinen – dank der Ähnlich­keit beider Sprachen – gute Er­gebnisse erzielt werden, sind Über­setzungen zwischen Chinesisch und Englisch viel kom­plexer aufgrund der er­heblichen Unter­schiede in der Syntax, Morphologie und Logik.

Generische oder maßgeschneiderte MT?

MT kann auf verschiedene Weise bereit­gestellt werden, je nach An­forderungen und Ein­schränkungen. So lassen sich generische Engines recht einfach und kosten­günstig bereit­stellen und nutzen. Dies hat aber natürlich Aus­wirkungen auf die er­reichbare linguistische Qualität. Die An­passung einer Engine an einen spezifischen Einsatz­bereich führt zwar zu besseren Er­gebnissen, ist je nach Sprache und Content jedoch mit ent­sprechenden Kosten verbunden. Oft fallen die Kosten für das Customizing nur an­fangs an und nicht fort­laufend. Wie bereits erwähnt, eignet sich eine maßgeschneiderte MT unter dem Gesichts­punkt des ROI am ehesten bei großen Content-Volumina.

MT-Post-Editing

Die MT-Ausgabe kann mit Post-Editing nach­bearbeitet werden. Hier prüfen Post-Editoren, beispiels­weise ent­sprechend ge­schulte Über­setzer oder Lektoren, die maschinellen Über­setzungen. Je nach den An­forderungen an das Er­gebnis kann Post-Editing in ver­schiedenen Qualitäts­stufen durch­geführt werden. Post-Editing ist besonders hilf­reich, um Terminologie zu finden, die die MT-Engine möglicher­weise nicht er­kannt oder falsch aus­gegeben hat. Dies kann der Post-Editor dann korrigieren. Die Engine kann zudem neu trainiert werden, um in Zukunft die richtigen Be­nennungen aus­zugeben und so den Post-Editing-Aufwand zu re­duzieren. Je nach Qualitäts­anforderungen und dem ent­sprechenden Maß an Post-Editing im Work­flow kann diese Phase na­türlich unter­schiedlich viel Zeit und Geld in Anspruch nehmen.

Informationssicherheit

Schließlich ist noch zu erwähnen, dass nicht alle MT-Anbieter dasselbe Maß an Informations­sicherheit für die in den MT-Engines ver­arbeiteten Daten bieten. Kosten­lose MT-Services wie Google Translate beispiels­weise speichern und nutzen die hoch­geladenen Daten, um ihre Engines zu trainieren. Einer der Vor­teile von be­zahlten MT-Services ist des­halb, dass Sicherheits­anforderungen bereits während der Ein­gangs­analyse ge­klärt und mit dem An­bieter von maschinellen Über­setzungen direkt ver­einbart werden können.

Wie erfolgt die MT-Bereitstellung?

Zwar kommt es immer auf die individuellen An­forderungen an, doch im All­gemeinen um­fasst die MT-Bereit­stellung folgende Phasen:

1. Eingangsanalyse

Dieser erste Schritt dient der Analyse der bereits be­stehenden Pro­zesse, der Fest­legung von Zielen, (z. B. welche Sprachen oder Content-Typen über­setzt werden sollen) und dem Auf­stellen von Qualitäts­anforderungen.

2. Pilotprojekt

In dieser Phase wird eine ge­eignete Engine auf Basis der Analyse­ergebnisse aus­gewählt und, im Falle einer maß­geschneiderten Engine, beginnt das Engine-Training.

3. Test

Die gewählte Engine wird entweder mittels auto­matischer oder manueller Über­prüfungen ge­testet und evaluiert, gegebenen­falls auch durch beides. Während der Test­phase soll er­mittelt werden, ob die Qualitäts­ziele er­füllt werden oder ob die Er­gebnisse weiter optimiert werden müssen.

4. Engine-Optimierung

Falls die Test­phase ergibt, dass die Aus­gabe ver­bessert werden muss, kann die MT-Engine mit zusätz­lichen Daten ge­füllt und weiter trainiert werden.

5. MT-Bereitstellung

In dieser Phase wird die MT-Engine in den Work­flow integriert, ent­weder durch Ver­knüpfung mit CAT-Tools (computer­unterstützte Über­setzung) oder Translation-Management-Systemen (TMS) oder aber als eigenständige Anwendung.

6. Wartung

Die MT-Engine wird überwacht und im Laufe der Zeit durch immer neuen Content weiter trainiert. Dies ist be­sonders wichtig, wenn neue Pro­dukte oder Services ein­geführt werden, ein Re­branding erfolgen soll oder ein Unter­nehmen seinen Kommunikations­stil ändern möchte.

Fazit: Eine erfolgreiche MT-Bereit­stellung er­fordert sorg­fältiges Vorgehen

Wie Sie sehen, sind bei der Kon­zeptionierung und Bereit­stellung eines MT-Systems viele Faktoren zu be­rücksichtigen. Welche Sprachen und welcher Content sollen über­setzt werden? Welche Qualitäts­anforderungen werden ge­stellt? Wie groß ist das Budget und der vor­gegebene Zeit­rahmen? All diese Faktoren sind bei der Wahl der am besten ge­eigneten Lösung zu be­rücksichtigen. Deshalb em­pfiehlt es sich immer, einen pro­fessionellen Lokalisierungs­anbieter ein­zubeziehen, der mit MT-Lösungen bestens vertraut ist. Dort werden Ihre An­forderungen analysiert und Ihre Kosten-, Zeit- und Qualitäts­vorgaben be­rücksichtigt, damit die bereit­gestellte MT-Lösung die von Ihnen ge­wünschten Er­gebnisse erzielt. Wir bei RWS Moravia sind führend in diesem Be­reich. Wir ar­beiten eng mit Unter­nehmen zu­sammen, um ihre individuellen Ziele zu er­mitteln und die dazu passende MT-Technologie zu implementieren. Sind Sie neugierig geworden? Wenn Sie mehr über dieses Thema er­fahren möchten, können Sie sich das gesamte Webinar anhören.
Lee Densmer
AUTOR

Lee Densmer

Lee Densmer ist seit 2001 in der Lokalisierungsbranche tätig. Sie begann als Projektmanagerin und wechselte dann zu Lösungsarchitektur und Marketing-Management. Wie viele Lokalisierungsexperten kam auch sie durch ihr Sprachinteresse und ihre linguistische Ausbildung zu diesem Bereich. Sie hat einen Master-Abschluss in Linguistik von der University of Colorado. Lee Densmer lebt in Idaho und unternimmt gern Auslandsreisen und Ausflüge in die umliegenden Berge.
Alle von Lee Densmer