Project Details
Projekt Print View

Structured Acoustic Models for Speech

Subject Area Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Term from 2001 to 2005
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5297148
 
Das Ziel des Vorhabens ist die verbesserte Strukturierung von akustischen Modellen für die Spracherkennung, um damit die Abhängigkeiten von Nebenfaktoren expliziter erfassen und eliminieren zu können. Sprachsignale, die die gleichen Wörter enthalten, können sich durch viele, unterschiedlich geartete Nebenfaktoren unterscheiden, die vom Menschen in der Regel instantan herausgefiltert werden: Überlagerung mit anderen Signalen, unterschiedliche Sprecher und Übertragungskanäle, äußere akustische Bedingungen. Da diese Variationen keine Information über die in den Sprachsignalen enthaltene Information liefern, ist das Ziel der Spracherkennung, die akustische Modellierung so zu gestalten, daß eine weitgehende und schnelle Trennung dieser Faktoren von der Sprachinformation gegeben ist. Eine bessere Strukturierung der akustischen Modelle soll dazu führen, daß weniger Parameter zu schätzen sind, und somit auch eine schnellere Verarbeitung und damit eine Annäherung an die menschliche Performanz erreicht wird. Bei der Entwicklung von strukturierten akustischen Modellen sollen auch physiologische und neurologische Erkenntnisse berücksichtigt werden. Zu diesem Zweck besteht eine Kooperation mit Prof.. Wagner und Dr. Gaese vom Institut für Biologie 2 an der RWTH Aachen.
DFG Programme Research Grants
 
 

Additional Information

Textvergrößerung und Kontrastanpassung