22 Januar 2008

EU-Kommission vereinfacht Zugang zu Übersetzungsdatenbank

Der Sprachdatenbestand der EU-Kommission soll ab sofort frei zugänglich gemacht werden. Das gab die Kommission am vergangenen Freitag bekannt. Damit sollen computergestützte Übersetzungen einfacher werden. Die Europäische Kommission verfügt mit einer Sammlung aus über einer Million Sätzen und deren hochwertiger Übersetzung in 22 der 23 EU-Amtssprachen über einen der weltweit größten Bestände.

Bei Entwicklern maschineller Übersetzungssysteme sind diese Art Daten hoch begehrt. Deren automatische Übersetzungsprogramme "lernen" von Humanübersetzungen, wie Wörter und Sätze im Zusammenhang richtig zu übersetzen sind. Aber auch bei der Entwicklung anderer Software könnten diese Daten hilfreich sein, zum Beispiel für Programme zur Grammatik- und Rechtschreibprüfung, Online-Wörterbücher und mehrsprachige Textklassifizierungssysteme.

Der für Mehrsprachigkeit zuständige EU-Kommissar Leonard Orban sagte hierzu: "Mit dieser Initiative möchte die Europäische Kommission die Sprachtechnologien voranbringen, die Mehrsprachigkeit fördern und die computergestützte Übersetzung einfacher, billiger und leichter zugänglich machen."

Die EU-Organe verfügen über weit mehr mehrsprachige Texte als jede andere Organisation, weil die EU-Vorschriften in allen 23 Amtsprachen vorliegen müssen. Ihre Übersetzungsdienste arbeiten mit 253 möglichen Sprachkombinationen und produzieren jährlich etwa 1,5 Millionen Übersetzungsseiten.

Weitere Informationen über die Übersetzungsdaten sind online unter http://langtech.jrc.it/DGT-TM.html.