Project Details
Structured Acoustic Models for Speech
Applicant
Professor Dr.-Ing. Hermann Ney
Subject Area
Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Term
from 2001 to 2005
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5297148
Das Ziel des Vorhabens ist die verbesserte Strukturierung von akustischen Modellen für die Spracherkennung, um damit die Abhängigkeiten von Nebenfaktoren expliziter erfassen und eliminieren zu können. Sprachsignale, die die gleichen Wörter enthalten, können sich durch viele, unterschiedlich geartete Nebenfaktoren unterscheiden, die vom Menschen in der Regel instantan herausgefiltert werden: Überlagerung mit anderen Signalen, unterschiedliche Sprecher und Übertragungskanäle, äußere akustische Bedingungen. Da diese Variationen keine Information über die in den Sprachsignalen enthaltene Information liefern, ist das Ziel der Spracherkennung, die akustische Modellierung so zu gestalten, daß eine weitgehende und schnelle Trennung dieser Faktoren von der Sprachinformation gegeben ist. Eine bessere Strukturierung der akustischen Modelle soll dazu führen, daß weniger Parameter zu schätzen sind, und somit auch eine schnellere Verarbeitung und damit eine Annäherung an die menschliche Performanz erreicht wird. Bei der Entwicklung von strukturierten akustischen Modellen sollen auch physiologische und neurologische Erkenntnisse berücksichtigt werden. Zu diesem Zweck besteht eine Kooperation mit Prof.. Wagner und Dr. Gaese vom Institut für Biologie 2 an der RWTH Aachen.
DFG Programme
Research Grants