Detailseite
Projekt Druckansicht

Strukturierte akustische Modelle für die Spracherkennung

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2001 bis 2005
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5297148
 
Das Ziel des Vorhabens ist die verbesserte Strukturierung von akustischen Modellen für die Spracherkennung, um damit die Abhängigkeiten von Nebenfaktoren expliziter erfassen und eliminieren zu können. Sprachsignale, die die gleichen Wörter enthalten, können sich durch viele, unterschiedlich geartete Nebenfaktoren unterscheiden, die vom Menschen in der Regel instantan herausgefiltert werden: Überlagerung mit anderen Signalen, unterschiedliche Sprecher und Übertragungskanäle, äußere akustische Bedingungen. Da diese Variationen keine Information über die in den Sprachsignalen enthaltene Information liefern, ist das Ziel der Spracherkennung, die akustische Modellierung so zu gestalten, daß eine weitgehende und schnelle Trennung dieser Faktoren von der Sprachinformation gegeben ist. Eine bessere Strukturierung der akustischen Modelle soll dazu führen, daß weniger Parameter zu schätzen sind, und somit auch eine schnellere Verarbeitung und damit eine Annäherung an die menschliche Performanz erreicht wird. Bei der Entwicklung von strukturierten akustischen Modellen sollen auch physiologische und neurologische Erkenntnisse berücksichtigt werden. Zu diesem Zweck besteht eine Kooperation mit Prof.. Wagner und Dr. Gaese vom Institut für Biologie 2 an der RWTH Aachen.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung