Subjective measurement and instrumental estimation of conversational speech quality based on perceptual dimensions
Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Final Report Abstract
In diesem Projekt wurde erstmals ein perzeptiver Raum in einer Konversationssituation definiert, eine subjektive Methode zur direkten Quantifizierung dieses Raumes festgelegt und ein neues diagnostisches instrumentelles Model zur Schätzung des Raumes entwickelt. Sprachtelekommunikationssysteme werden am häufigsten für Telefongespräche eingesetzt. In dieser Hinsicht ist die Qualität der übertragenen Sprache eine wichtige Messgröße für die Systementwickler, um ihre Systeme zu klassifizieren und zu bewerten. Es reicht jedoch nicht aus, nur die Gesamtqualität zu messen, vielmehr sollten auch diagnostische Informationen bezüglich möglicher niedriger Qualitätsbewertungen zur Verfügung gestellt werden. Allerdings sind traditionelle Methoden zu Bestimmung der Qualität übertragener Sprache darauf beschränkt, entweder nur die Gesamtqualität zu messen oder diagnostische Informationen auf der Basis von perzeptiven Dimensionen nur für die passive Hörsituation bereitzustellen. Eine multidimensionale Analyse von Telefongesprächen wurde mit dem Ziel, diagnostische Informationen der Qualität von Telefongesprächen zu liefern, durchgeführt. Hierfür wurde ein Telefongespräch in drei Gesprächsphasen aufgeteilt (Hören, Sprechen und Interagieren) und für jede Phase wurden in vier umfangreichen Experimenten entsprechende perzeptive Dimensionen identifiziert. Resultierend ergibt sich ein Raum von sieben perzeptiven Dimensionen, die während eines Telefongespräches wahrgenommen werden können. Die Entwicklung eines neuen analytischen Testverfahrens ermöglicht es, auf direktem Weg die identifizierten perzeptiven Dimensionen von untrainierten Hörern bewerten zu lassen. Die identifizierten perzeptiven Dimensionen und das neue Testverfahren wurden in zwei ausgiebigen Experimenten validiert. Die sich ergebenen Dimensionsbewertungen wurden verwendet, um die Gesamtqualität jeder einzelner Gesprächsphase und der Gesamtqualität des Telefongespräches zu modellieren. Es ergibt sich somit ein neuartiges Qualitätsprofil, welches die Diagnose und tiefergehende Analyse eines Telefongesprächs erlaubt. Die durchgeführte Grundlagenforschung bildet die Basis für die Entwicklung eines vorläufigen neuen instrumentellen diagnostischen Qualitätsmodells für Telefongespräche. Zusammenfassend sind die im Projekt durchgeführten Arbeiten und Analysen ein wichtiger Meilenstein auf dem Weg zur Analyse der Qualität interaktiver Telefongespräche, um Sprachtelekommunikationssysteme zu diagnostizieren und zu optimieren.
Publications
- Analyzing Perceptual Dimensions of Conversational Speech Quality. Proc. 15th Ann. Conf. of the Int. Speech Comm. Assoc. (Interspeech 2014). ISCA Interspeech 2014 Proceedings, pp. 2041-2045, Singapore, Singapore, 2014
F. Köster and S. Möller
- Perceptual Speech Quality Dimensions in a Conversational Situation. Proc. 16th Ann. Conf. of the Int. Speech Comm. Assoc. (Interspeech 2015). ISCA Interspeech 2015 Proceedings, pp. 2544-2548, Dresden, Germany, 2015
F. Köster and S. Möller
- Analyzing the Relation Between Overall Quality and the Quality of Individual Phases in a Telephone Conversation. Proc. 17th Ann. Conf. of the Int. Speech Comm. Assoc. (Interspeech 2016). ). ISCA Interspeech 2016 Proceedings, pp. 2493-2497, San Francisco, USA, 2016
F. Köster and S. Möller
(See online at https://dx.doi.org/10.21437/Interspeech.2016-255) - Introducing a new Test-Method for Diagnostic Speech Quality Assessment in a Conversational Situation. Fortschritte der Akustik, DAGA 2016: Dtsch. Jahrestg. f. Akust.. DEGA, pp. 1409-1412, Aachen, Germany, 2016
F. Köster and S. Möller
- Identifying speech quality dimensions in a telephone conversation. Acta Acustica united with Acustica, vol. 103, no. 3, pp. 506-522, 2017
F. Köster and D. Guse and S. Möller
(See online at https://doi.org/10.3813/AAA.919079) - Modeling the Overall Conversational Quality Based on the Identified Underlying Perceptual Quality Dimensions. Fortschritte der Akustik – DAGA 2017: 43. Dtsch. Jahrestg. f. Akust.. DEGA, pp. 849-852, Kiel, Germany, 2017
F. Köster and S. Möller