Structured Acoustic Models for Speech

Applicant Professor Dr.-Ing. Hermann Ney

Subject Area Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing

Term from 2001 to 2005

Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5297148

Project Description

Das Ziel des Vorhabens ist die verbesserte Strukturierung von akustischen Modellen für die Spracherkennung, um damit die Abhängigkeiten von Nebenfaktoren expliziter erfassen und eliminieren zu können. Sprachsignale, die die gleichen Wörter enthalten, können sich durch viele, unterschiedlich geartete Nebenfaktoren unterscheiden, die vom Menschen in der Regel instantan herausgefiltert werden: Überlagerung mit anderen Signalen, unterschiedliche Sprecher und Übertragungskanäle, äußere akustische Bedingungen. Da diese Variationen keine Information über die in den Sprachsignalen enthaltene Information liefern, ist das Ziel der Spracherkennung, die akustische Modellierung so zu gestalten, daß eine weitgehende und schnelle Trennung dieser Faktoren von der Sprachinformation gegeben ist. Eine bessere Strukturierung der akustischen Modelle soll dazu führen, daß weniger Parameter zu schätzen sind, und somit auch eine schnellere Verarbeitung und damit eine Annäherung an die menschliche Performanz erreicht wird. Bei der Entwicklung von strukturierten akustischen Modellen sollen auch physiologische und neurologische Erkenntnisse berücksichtigt werden. Zu diesem Zweck besteht eine Kooperation mit Prof.. Wagner und Dr. Gaese vom Institut für Biologie 2 an der RWTH Aachen.

DFG Programme Research Grants

Servicenavigation

Hauptnavigation

Structured Acoustic Models for Speech

Additional Information

Servicenavigation

Hauptnavigation

Structured Acoustic Models for Speech

Additional Information

Textvergrößerung und Kontrastanpassung