Fachbücher

 
  Programm
Appetithappen
Bestellung

 

doculine Archiv

  Übersicht
Index
Autoren
Streifzüge

 
 

Service

 
  transline tecNews
Suche
Impressum
 

Aktuelle Artikel und Nachrichten rund um die technische Dokumentation finden Sie im Nachfolgemagazin der doculine news, den transline tecNews

Translation Memories:
das elektronische Gedächtnis der Übersetzung

 

Artikel erschienen in
Ausgabe Oktober 2000

Von Birgit M. Hoppe

Inhaltsübersicht:

Nachdem hohe Investitionen und wenig marktfähige Resultate die übersteigerten Erwartungen an die Maschinelle Übersetzung (MÜ) zunächst stark abgekühlt hatten, eroberte das Translation-Memory-Prinzip leise das Feld der praktischen Anwendung und gehört bei der Übersetzung technischer Dokumentation heute zum Stand der Technik. Wie lässt sich das Translation-Memory-Prinzip im heutigen Umfeld optimal nutzen? Und wie sieht es morgen damit aus?


Übersetzungs-Recycling

Der Begriff Translation Memory (TM) bedeutet wörtlich Übersetzungsspeicher. Die zugrunde liegende Idee ist denkbar einfach: Alles nur einmal übersetzen – Übersetzungen wiederverwenden. Der Computer bzw. die Software übersetzt dabei in keiner Weise; TM-Systeme (TMS) zielen vielmehr darauf ab, die einmal vom menschlichen Übersetzer erstellte und freigegebene Übersetzung eines Textabschnitts immer wieder für identische Textabschnitte zu verwenden.

Die Anwendung des TM-Prinzips gibt als praktiziertes Wissensmanagement die Antwort auf die gestiegenen Anforderungen an die Übersetzung:

  • Immer umfangreichere und komplexere Dokumentationen sind in immer kürzeren Update-Zyklen in verschiedenen Zielsprachen druckfertig zu erstellen. Dabei sind nur einige Textteile tatsächlich neu zu übersetzen.
  • Text und Terminologie sind nicht nur innerhalb einer Dokumentation, sondern über mehrere Versionen und Generationen hinweg konsistent zu übersetzen, auch wenn mehrere Übersetzer daran arbeiten.
  • Die Dokumentation liegt in komplexen Layouts (FrameMaker, PageMaker, Interleaf, QuarkXpress) oder in strukturempfindlichen Formaten (SGML/HTML, Online-Hilfe, Source-Code) vor.

Seit den ersten Einsätzen von Computern für Textbearbeitung entwickelten Anwender Ideen für die Wiederverwendung von Textbausteinen. Aus Listen, Tabellen und Makros wurden mehrbenutzerfähige Datenbanken mit halbautomatischem Vergleich und Übersetzen von Texten.

Die nachfolgende Entwicklung wurde zunehmend von Übersetzungsunternehmen weitergeführt, die aus mehreren Nöten eine Tugend machten: Der Vergleich von zu übersetzendem Text und alten Textbausteinen funktionierte nur innerhalb eines Formates einwandfrei und auch die Übersetzer konnten nicht mit allen Formaten gleichermaßen umgehen. Also wurden verschiedene Formate durch entsprechende Bearbeitung mit Filtern in ein einheitliches Arbeitsformat gebracht. Damit waren die Grundlagen für den klassischen Ablauf mit TMS gelegt.


So funktioniert das Translation-Memory-Prinzip

Im Übersetzungsspeicher, dem eigentlichen Translation Memory, sind ausgangssprachliche und die dazugehörigen übersetzten Textabschnitte aus alten Übersetzungen als so genannte Segmente zusammen abgelegt. Der Begriff Segment bezeichnet eine Texteinheit, die nach ausgewählten Regeln als vollständige Übersetzungseinheit (ÜE) gelten soll: ein Satz, ein Aufzählungspunkt, der Inhalt einer Tabellenzelle, ein Absatz.

Ein neu zu übersetzender Text wird zuerst in das TMS importiert. Dabei wird, falls erforderlich, die Originalformatierung herausgefiltert und durch Tags ersetzt. Das TMS segmentiert dann die getagten Dateien nach den festgelegten Regeln. Der Übersetzer lässt die neuen Segmente mit den ausgangssprachlichen Segmenten im Übersetzungsspeicher vergleichen. Wenn das TMS dort ein dem zu übersetzenden Segment entsprechendes findet, dann bietet es das gespeicherte äquivalente Segment der Zielsprache als neue Übersetzung an.

Das Translation-Memory-Prinzip

Match oder kein Match?
  • Wiederholungen:
    Übersetzungseinheiten, die im aktuellen Übersetzungsprojekt mindestens zweimal vorkommen, gelten als Wiederholungen. Ein wiederholt vorkommender Satz muss nur einmal manuell übersetzt werden; das TMS bietet bei allen weiteren Vorkommen die schon erstellte Übersetzung an.
  • Exaktes Match:
    Ein zum aktuell zu übersetzenden Segment identisches Segment im TM gilt als Match (Englisch für passendes Gegenüber, Treffer) bzw. exaktes Match oder 100%-Match.
  • Bedingt exaktes Match:
    Oft unterscheiden sich die neuen Dokumente von den Vorgängerversionen durch bestimmte, definierbare Elemente wie z.B. Zahlen, Formatierungstags oder Produktnamen. TM-Systeme bieten üblicherweise Möglichkeiten, solche unterschiedlichen Elemente vom inhaltlichen Vergleich auszuschließen und/oder zulässige Äquivalente zu definieren: Das TMS betrachtet dann Segmente, die sich nur durch das definierte Ausschlusselement bzw. Äquivalent unterscheiden, als Match. Es übernimmt die Übersetzung und ersetzt dabei das Ausnahmeelement des Übersetzungssegmentes durch das betreffende des aktuellen Ausgangssegmentes. Je nach TMS erhalten das derartig übersetzte Segment und/oder das ausgetauschte Element eine besondere Kennzeichnung.
  • Fuzzy Match:
    Wenn sich ein zu übersetzendes Segment anders als oben beschrieben von einem möglichen Referenzsegment unterscheidet, kann das TMS die Segmente dennoch vergleichen: Es errechnet über einen im System hinterlegten Algorithmus die Ähnlichkeit der beiden Segmente als prozentualen Wert. Unterschiede können je nach TMS typisiert und unterschiedlich gewichtet werden (z.B. Interpunktionszeichen). Wenn das TMS ein Segment findet, dessen Ähnlichkeit über dem benutzerdefinierten Wert liegt, dann gilt das ähnliche Segment als so genanntes Fuzzy Match (Englisch für unscharfer Treffer).

Üblicherweise fügt das TMS die zielsprachlichen Segmente der exakten Matches automatisch und im Batch-Verfahren in alle Dateien der neuen Übersetzung ein. Dies wird oft als automatische (Vor-) Übersetzung bezeichnet, was zu Missverständnissen führen kann. Bei der Übernahme von Fuzzy Matches gibt der Projektmanager einen Mindestähnlichkeitswert an. Das TMS übernimmt entsprechend passende Übersetzungen in die aktuelle Übersetzung und kennzeichnet sie mit der Angabe des Ähnlichkeitswertes in Prozent. Beim interaktiven Zugriff auf das TM kann der Übersetzer mehrere Matches nacheinander abfragen, vergleichen und das am besten geeignete auswählen. Über Selektionsfunktionen (Filter) des TMS kann der Projektmanager oder Übersetzer zudem gezielt auf die jeweils gültigen Projekt- oder Kundendaten in den TM-Beständen zugreifen.

 

Beispiele von Übersetzungsumgebungen mit Editor, Zugriff auf das Translation Memory und die Terminologieverwaltung
(zum Vergrößern bitte auf die Bilder klicken)

Der fertiggestellten Übersetzung werden beim Export aus dem TMS die Formatierungsinformationen des Originaldokuments wieder zugeordnet.

Auf dem Markt sind verschiedene Varianten von TM-Systemen erhältlich, von der voll integrierten Stand-alone-Arbeitsumgebung bis zu separaten Funktionsmodulen für z.B. Projektmanagement, Datenvor- und -nachbereiten und Übersetzen. Die eigentliche Übersetzungsumgebung besteht üblicherweise aus einem Übersetzungseditor, einer Zugriffsmöglichkeit auf die TM-Bestände sowie einer Terminologieverwaltung.

Das TM-Prinzip nutzt beim erstmaligen Übersetzen ohne vorhandenen Übersetzungsspeicher nicht viel. Zwar erweitert sich das TM bereits während der Übersetzung des aktuellen Projektes und verwendet die soeben erstellten Übersetzungen. Es können aber auch im Voraus Altdaten als TM aufbereitet werden, so dass das (bereits einmal bezahlte) Wissen in den vorhandenen Übersetzungen weiterlebt. Die gängigen TM-Systeme bieten hierzu so genannte Alignment-Tools an. Sie unterstützen den Übersetzer dabei, die Segmente der ins TMS-Format importierten Ausgangs- und Zieltexte einander zuzuordnen, so dass korrekte Übersetzungseinheiten ins TM übernommen werden können.

Der Einsatz von TM-Systemen bietet die folgenden Vorteile:

  • Er spart Zeit und damit Geld.
  • Er unterstützt die Terminologiekonsistenz auch dann, wenn mehrere – auch räumlich getrennte – Übersetzer mit dem gleichen TM an einem Projekt arbeiten (Distributed Translation).
  • Er ermöglicht dem Übersetzer das Bearbeiten von Texten unterschiedlicher Ausgangsformate in einer einheitlichen Arbeitsumgebung unabhängig von der Erstellungssoftware (wie Interleaf, FrameMaker, HTML-Editor).

Sinnvoll ist der Einsatz von TM-Systemen vor allem bei Textsorten mit hoher Wiederholungsrate innerhalb eines umfangreichen Textes oder einer Reihe von Texten (Updates, Dokumentationen zu Produktgruppen oder Bauvarianten). Kurze Texte, die stark variieren oder sehr frei übersetzt werden müssen, wie z.B. Marketingtexte, sind dagegen für die Bearbeitung mit TMS wenig geeignet.


Den TM-Einsatz bereits im Vorfeld optimieren

Bereits die Qualität des Ausgangstextes ist entscheidend für einen effektiven Übersetzungsprozess mit TMS. Die Beachtung der folgenden Punkte hilft, den Übersetzungsprozess zu vereinfachen und die Möglichkeiten des TMS optimal zu nutzen:

  • Gut formatierte Dokumente (mit generierten Verzeichnissen, mit Absatzformaten statt manueller Formatierung, ohne unnötige Zeilenumbrüche oder manuelle Trennstriche) lassen sich sauber mit TMS bearbeiten.
  • Ausreichend Raum für länger laufende Zielsprachen im Ausgangslayout (bis 30% für z.B. romanische Sprachen) reduziert die manuelle Nacharbeit in den übersetzten Dokumenten.
  • Klare Syntax (ohne Schachtelsätze, mit einheitlicher Positionierung von Elementen wie z.B. Querverweisen außerhalb des Satzes) verbessert die Segmentierung und erleichtert die Übersetzung in Sprachen mit anderem Satzbau.
  • Klare Informationen, welche Textelemente (Machinenbefehle, Display-Texte) zu übersetzen sind und welche nicht, lassen sich im TMS umsetzen und verhindern Fehlübersetzungen.
  • Eine Liste der zulässigen (und ausschließlich verwendeten) Abkürzungen ermöglicht korrekte Segmentierung durch das TMS.
  • Konsistente, eindeutige und verständliche Terminologie im Ausgangstext (ohne Synonyme und eigene Wortschöpfungen) bildet die Grundlage für eine ebenso konsistente und eindeutige Übersetzung.


Was verlangt die Zukunft von TM-Systemen?

Das Übersetzen mit TMS kann zukünftig noch weniger als heute als unabhängiger Prozess innerhalb eines Systems betrachtet werden. Der Trend führt zu Austausch und Integration.

TMS sollen das Übersetzen unabhängig vom Originalformat ermöglichen. Die verschiedenen TMS erzeugen aber zur Verwaltung der Übersetzungseinheiten eigene Strukturen. Übersetzungsdienstleister arbeiten mit vielen freiberuflichen Übersetzern, die ihrerseits wieder für verschiedene Auftraggeber tätig sind. Übersetzer und Übersetzungsdienstleister können so in die Lage kommen, mehrere TMS erwerben und einsetzen zu müssen. Auch Unternehmen, die ihre Übersetzungsprojekte komplett von einem externen Übersetzungsdienstleister bearbeiten lassen, legen zunehmend Wert auf die bei der Übersetzung aufgebauten TM-Bestände. Diese beinhalten schließlich wertvolles Kapital und Unternehmenswissen, das sonst z.B. bei einem Wechsel des Übersetzungsdienstleisters verloren wäre. Ein ausschließlich TMS-proprietäres Speicherformat scheint weder zukunftssicher noch integrierbar in Standard-Information-Retrieval-Systeme.

Das Dilemma unterschiedlicher TM-Strukturen lässt sich durch die Festlegung eines Standardformats für den TM-Austausch lösen: Eine Gruppe der LISA (Localisation Industry Standards Association) mit der Bezeichnung OSCAR für Open Standards for Container/Content Allowing Re-use entwickelte einen Standard für ein entspechendes Austauschformat. Die LISA konnte im Juli 1998 die erste Version des auf diesem Standard beruhenden Austauschformats als TMX (Translation Memory eXchange) eintragen. Spezifikation und Strukturbeschreibung für TMX sind unter www.lisa.org verfügbar. Die LISA vergibt kostenfrei Lizenzen für die Verwendung der Spezifikation, behält sich aber das Recht vor, Software-Produkte mit dem Anspruch auf entsprechende Vermarktung auf die Einhaltung der OSCAR-Regeln zu testen. Auf den Druck des Marktes hin unterstützen heute schon die aktuellen Versionen der wichtigsten TM-Systeme den Import und Export von TM-Beständen im TMX-Format.

Verschiedene vormals separat ablaufende Prozesse müssen aufeinander abgestimmt werden und können über eine Workflow-Engine miteinander verzahnt und gesteuert werden. Die folgenden Beispiele skizzieren typische Kombinationen mit TMS:

  • Integration TM – Maschinelle Übersetzung (MÜ)
  • Abwicklung von Übersetzungsprojekten über Workflow-Systeme
  • Dokumentenmanagement-System (DMS) – TMS

Bei der Integration TM – Maschinelle Übersetzung steuert das TMS den Ablauf des Übersetzungsprojekts, importiert die ausgangssprachlichen Daten, führt die TM-Auswertung durch und übernimmt die Übersetzungen vorhandener Textabschnitte in die neuen Dokumente. Das TMS übergibt dann die aus dem TM nicht übersetzten Textabschnitte zusammen mit der Projektterminologie an ein System für maschinelle Übersetzung. Das MÜ-System gibt seine Übersetzungsergebnisse wieder an das TMS, wo sie den Übersetzer als Fuzzy Matches interaktiv beim Übersetzen unterstützen. Mehrere TMS-Hersteller bieten Schnittstellen zu einem oder mehreren MÜ-Systemen (z.B. Logos, Systran) optional an.

Die Integration von TM und MÜ in einen Workflow beschleunigt die Übersetzung umfangreicher Dokumentation und kombiniert Zuverlässigkeit des TM-Prinzips und Flexibilität der TM-Systeme mit Schnelligkeit und Massendurchsatz der MÜ. Noch ist diese Lösung wegen der hohen Investitionen an Geld und Vorbereitung vor allem für die firmeninterne Übersetzung großer Umfänge geeignet. Die Beobachtung des Übersetzungsmarktes im Internet zeigt aber bereits entsprechende Dienstleistungsangebote, deren Slogans wie "Übersetzung über Nacht" noch Zweifel an der Qualität aufkommen lassen. Durch längerfristige interaktive Kundenbeziehungen lässt sich aber auch hier zweifelsohne Qualität wie in traditionellen Geschäftsbeziehungen erreichen.

Die Abwicklung von Übersetzungsprojekten über eine verschiedene Systeme integrierende Workflow-Engine lässt sich in verschiedenen Kombinationen realisieren: Die Workflow-Software stößt die TM-Prozesse an, schickt die Daten mit entsprechender Benachrichtigung an die jeweils nächste Station und führt zudem Daten für die Abrechnung des Projektes mit.

Bei der EU und in der Industrie werden bereits spezifisch programmierte Abläufe mit verschiedenen Systemkombinationen durchgeführt. In gewissem Sinn gehört auch die Integration TM – MÜ dazu. Wie bei TMS entwickeln hier ebenfalls Übersetzungsdienstleister zunächst intern umgesetzte Lösungen und präsentieren sie bei entsprechender Reife auf dem Markt.

Der Trend zum elektronisch gesteuerten Workflow beschränkt sich mit Dokumentenmanagement-Systemen (DMS) und Content-Management-Systemen (CMS) nicht nur auf die Bereiche Dokumentationserstellung und -verwaltung, sondern ergreift auch Publikation und Übersetzung. DMS/CMS können

  • bei Bedarf aus den formatneutral abgelegten Modulen eine gerätespezifische Dokumentation in jeder vorhandenen Sprache publikationsfähig zusammenstellen
  • nach der Erstellung eines neuen Textmoduls sofort diese Daten an die Übersetzung weitergeben, so dass wirklich nur neue Texte ausgecheckt werden

Macht diese Entwicklung TMS in der aktuellen Form nicht auf lange Sicht überflüssig? Nein, denn dies würde u.a. ein DMS zur funktionsüberfrachteten Rundumlösung aufblähen. In der Gegenwart realisieren sich bereits Integrationen zwischen eigenständig bleibenden Systemen über Schnittstellen, die jedes System auf seine Kernprozesse konzentrieren. Der Kunde will zunehmend Offenheit und Flexibilität. Standardisierung von (Austausch-) Formaten und Integration von Spezialisten-Systemen begleiten ihn auf diesem Weg.


Der Link zu Hintergrundinformationen:

Einen Vergleich einiger TM-Systeme finden Sie unter www.fortunecity.com/skyscraper/true/1323/cat.htm#Conclusion.

 

  Doculine durchsuchen:   

  

Empfehlenswerte Seiten zur technischen Übersetzung
von transline - Übersetzungsdienst für technische Übersetzung
technische Übersetzungen | Übersetzung Software | Software Lokalisierung
Spez. Seiten zu Sprachen
Chinesisch Übersetzung | Englisch Übersetzung | Französisch Übersetzung | Niederländisch Übersetzung | Russisch Übersetzung | Spanisch Übersetzung | Portugiesisch Übersetzung | Italienisch Übersetzung | Japanisch Übersetzung
Infos zum Übersetzungsservice transline

Übersetzungen Ihrer Patente - Dr. Sturz Patentübersetzungen

Letzte Änderung: 31.10.2005 | Presse-Service | Disclaimer
© doculine Verlags-GmbH, ein Unternehmen der transline Gruppe