Detailseite
Kerntechnologien für statistische maschinelle Übersetzung
Antragsteller
Professor Dr.-Ing. Hermann Ney
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2017 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 327471424
Dieser Antrag ist eine aktualisierte und überarbeitetete Version unseres Antrages aus 2015.In der statistischen maschinellen Übersetzung (SMT) sind große Fortschritte gemacht worden. Trotzdem erfassen die existierenden statistischen Verfahren noch nicht alle relevanten wechselseitigen Abhängigkeiten zwischen den Wörtern des Quellsatzes und des Zielsatzes. Dieser Projektvorschlag der RWTH Aachen konzentriert sich auf drei Probleme, um den Stand der Wissenschaft in der maschinellen Übersetzung von geschriebener und gesprochener Sprache zu verbessern:1) Künstliche neuronale Netze (NN): Wir werden die existierenden NN-Ansätze erweitern, um die Abhängigkeiten zwischen Quellsatz und Zielsatz besser zu modellieren; insbesondere werden wir rekurrente neuronale Netze und auch ihre Verwendung für das Wortumordnungsproblem untersuchen. Für die deutsche Sprache ist das Wortumordnungsproblem in der SMT besonders schwierig, weil ihre Wortstellung sich von der anderer Sprachen deutlich unterscheidet.2) Erweiterte Übersetzungsmodelle und verbessertes, konsistentes Training: Die existierenden Phrasenmodelle sind aus statistischer Sicht unbefriedigend; insbesondere gibt es zur Zeit kein konsistentes Training der Phrasenmodelle.3) Interface für gesprochene Sprache: Zusätzlich zu Text soll in diesem Projekt auch die Übersetzung von gesprochener Sprache untersucht werden. Der Ausgang eines ASR-Systems (ASR = automatic speech recognition) dient als Input für das Übersetzungssystem; ein weiteres Ziel dieses Projektes ist es, diese Schnittstelle zwischen ASR und SMT zu verbessern mit Methoden wie Generierung von Satzzeichen, erweiterte Worthypothesengitter und gemeinsame Optimierung der ASR-SMT-Kette.
DFG-Verfahren
Sachbeihilfen