Beipackzettel 40
Wissenswertes für Kunden und Partner von mt-g.
Februar 2017
Im Fokus
Terminologieextraktion
Im 38. Beipackzettel haben wir Ihnen einen Überblick über das Terminologiemanagement gegeben. Hieran möchten wir mit zwei weiteren Artikeln anknüpfen. In unserem ersten Artikel bringen wir Ihnen näher, was unter einer Terminologieextraktion verstanden wird.

Wohin geht die Reise?

Das Ziel einer Terminologieextraktion ist, relevante Begrifflichkeiten – die Termkandidaten – zu sammeln, zu bewerten und in eine Datenbank aufzunehmen. Die Termextraktion findet naturgemäß in der Ausgangssprache statt. Nach der Freigabe der ausgangssprachlichen Termkandidaten werden die zielsprachlichen Entsprechungen festgelegt und ebenfalls freigegeben.
Auf diese Weise kann schon bei der Textproduktion auf Konsistenz geachtet werden. Dies schränkt die Verwendung von mehreren ausgangssprachlichen Varianten ein und vermindert den Korrekturaufwand auch bei der späteren Übersetzung sowie deren Prüf- und Validierungsdurchgängen.

Viel hilft viel, aber nicht immer

Ein erster Schritt ist die Auswahl des geeigneten Materials. Hierbei sind zwei Gesichtspunkte wichtig: für gut befundene und freigegebene Materialien sind eine sinnvolle Basis, um keine unnötigen Varianten aufzunehmen. Nachrangig sollte versucht werden, Dokumente mit einer ausreichendenden, sogenannten Termdichte zu verwenden, das heißt, Texte zur Hand zu nehmen, die mit Fachbegriffen gespickt sind. Es kann dann durchaus sinnvoll sein, ein weniger umfangreiches Dokument zu verwenden, wenn es besonders ergiebig ist.
Bei der Auswahl der Termkandidaten selbst darf sparsam vorgegangen werden: längst nicht jedes Wort sollte aufgenommen werden, gesucht werden nur Fachbegriffe. Die am häufigsten vorkommenden Wörter haben oft eine rein grammatikalische Funktion und sind keine Bezeichnungen für Gegenstände oder Vorgänge. Diese Stoppwörter werden aussortiert. Der Terminologe interessiert sich hauptsächlich für Bezeichnungen, üblicherweise durch Substantive ausgedrückt:

  • Nominalphrasen (selbstschmierendes Butterbrotmesser)
  • Komposita (Aufstreichhilfe)
  • geläufige und ungeläufige Substantive (Gabel / Forke)
  • Produktnamen (SeBuBroM)

Er entscheidet, welche Bezeichnungen Einzug in die Termdatenbank halten. Dazu wird er Fach- und Produktbezogenheit als Indikatoren heranziehen und abwägen, ob eine Übernahme stattfindet. Das Ergebnis kann dann idealerweise als Kernwortschatz einer Firma oder einer bestimmten Produktreihe dienen. Mut zur Sparsamkeit ist in diesem Fall nicht falsch – Qualität steht hier vor Quantität.
Welche Extraktionsmethode (manuell oder automatisiert) angewendet wird, hängt hauptsächlich vom Abteilungsbudget und der zur Verfügung stehenden Zeit ab. Von Hand die wichtigsten Begrifflichkeiten aus zentralen Dokumenten in eine einfache Excel-Liste aufzunehmen, kann durchaus einen guten Grundstock an Terminologie entstehen lassen. Softwaregestützte Terminologieextraktion ist schon mit den meisten CAT-Systemen möglich, so z. B. mit crossTerm von Across oder MultiTerm Extract 2015 von SDL. Einige dieser Programme unterstützen auch eine mehrsprachige Termextraktion.

Automatisierung und Investition in die Zukunft

Eine Termextraktionssoftware durchforstet Ihre Dokumente anhand bestimmter Vorgaben (anhand statistischer und linguistischer Regelwerke) und erzeugt am Ende eine Liste sogenannter Termkandidaten, inklusive der Angabe der jeweiligen Häufigkeit des Vorkommens. Diese Vorauswahl ist hilfreich, aber nicht perfekt: Die Auflistung enthält eine Vielzahl abzulehnender Termkandidaten, außerdem zusätzlich zur Grundform eines Wortes alle möglichen gebeugten Formen.
Zuletzt sei erwähnt, dass sich je nach Szenario auch eine mehrsprachige Termextraktion anbieten kann, beispielsweise wenn es freigegebene Inhalte in mehreren Sprachen gibt.
Unsere Qualitätsstandards sind durch die tiefe Spezialisierung und
fortwährende Prozessoptimierung auf einem außergewöhnlich hohen Niveau.