Relations between Speech Intelligibility, Vocal-Tract Behaviour, and Brain Activity for Speech-handicapped Parkinson Patients
Final Report Abstract
Es wurden folgende drei Bereiche untersucht: Instrumentelle Messung der Sprachverständlichkeit sprechbehinderter PD-Patienten, Artikulationsverhalten sprechbehinderter PD-Patienten, Gehirnaktivität von PD-Patienten mit unterschiedlicher körperlicher und sprachlicher Störung. Zur instrumentellen Messung wurden zahlreiche Merkmale aus den Sprachsignalen extrahiert und mittels Methoden der Musterkennung zu Teil- und Gesamtwertungen zusammengefasst. Die resultierenden Größen sollen dabei möglichst gut mit menschlichen Wertungen (gemäß der sog. NTID-Skala2) übereinstimmen. Hierbei wurden z.B. Codebücher in Echtzeit (jeweils auf der Basis von 5 Sekunden aktiver Sprache) trainiert. Die resultierunden Codebucheinträge wurden dann nachprozessiert und die Ergebenisse mittels neuronaler Netze auf menschliche Wertungen umgerechnet. Es konnte gezeigt werden, dass sich durch Kombinationen aus unterschiedlichen Verfahren hohe Korrelationen zwischen den geschätzten und den menschlichen Wertugen erzielen lassen. Außerdem lagen die Betragsfehler (im Sinne der Wertungsunterschiede zwischen Algorithmen und Menschen) in akzeptabel kleinen Bereichen (kleiner als eine Notenstufe bei einer Skala von 1 bis 6). Zum zweiten Schwerpunkt wurden umfangreiche Untersuchungen durchgeführt: Das einfache LPC-Modell für die „akustische Röhre Sprechtrakt“ wurde auf seine Verwendbarkeit zur Artikulationsanalyse allgemein geprüft und dann auf gehaltene Vokale und Fließtexte angesetzt. Neben diesen qualitativen Beobachtungen wurden die Untersuchungen des Röhrenmodells so erweitert, dass daraus zahlreiche Parameter zur Schätzung der Verständlichkeit auf der NTID-Skala extrahiert werden konnten. Eine Verständlichkeitsschätzung, d.h. ein Lösungansatz für den ersten Schwerpunkt, wurde darüber hinaus auf der Basis verschiedener Spracherkenner-Systeme aufgebaut. Sie ist weniger erfolgreich als zwei schließlich verfolgte neue Ansätze (ein Gauß-Mixtur-Ansatz und ein Neuronales Netz), die aus optimierten Signalparametern dann in einem zweitstufigen Ansatz entprechende Schätzungen durchführen. Hier lag der höchste Zeitaufwand bei der Projektbearbeitung. Im letztgenannten Schwerpunkt konnten nur erste Ansätze verfolgt werden. Dafür gibt es zwei Gründe: Ein für die Quellenanalyse vorgesehenes 256-Kanal-EEG-System war genau zur geplanten Bearbeitungszeit defekt und die Reparatur durch den Hersteller erstreckte sich über einen langen Zeitraum. Ein Ausweichen auf ein 32-Kanal-System zeigte leider nicht die notwendige räumliche Genauigkeit um aussagekräftige Quellenrekonstruktionen zu ermöglichen. Außerdem stellte sich die angestrebte Vorwärtsmodellierung auf der Basis eines 3-Schichten- Modells bzw. auf der Basis eines „Standard“-Gehirn-Kopf-Modells als nur unzureichend dar. Der Übergang auf bessere Vorwärtsmodelle hätte MRT-Analysen der Patienten zur Folge gehabt, welche den Umfang des Teilprojekt deutlich vergrößert hätten. Der dritte Bereich bzw. Schwerpunkt wurde daher nicht in der geplanten Tiefe bearbeitet. Die dadurch frei gewordene Arbeitskapazität wurde allerdings auch dringend gebraucht und somit sinnvoll verwendet: viele der an sich vorhandenen Sprachaufnahmen waren qualitativ nicht ausreichend, so dass erstens eine umfangreiche „Entstörung“ durchgeführt werden und zweitens für neue Aufnahmen eine neue Hard- und Software-Umgebung in Form eines automatisch fokussierenden Mikrophon-Arrays entwickelt werden konnte. Die beiden Antragsteller beabsichtigen, das Thema „Gehirnaktivität beim Sprechvorgang von PD-Patienten“ nun im neu gefundenen Kooperationsnetzwerk mit internen Mitteln aufzugreifen.
Publications
- Neural Effects of Lee Silvermann Voice Treatment in Parkinson`s Disease, Congress of the European Academy of Neurology 2015, Berlin, Deutschland, 2015
Baumann, G. Hartwigsen, A. Nebel, S. Wolff, W. Schmidt, C. Baasch, G. Schmidt, G. Deuschl, K. E. Zeuner, and T. van Eimeren
- Level-correct Speech Recordings for the Analysis of Parkinson Speech, Proc. DAGA 2016, Aachen, Deutschland, 2016
L. Jaschke, C. Baasch, G. Schmidt, A. Nebel, G. Deuschl
- Parkinson-Speech Analysis: Methods and Aims, ITG Konf. Sprachkommuniaktion 2016, Paderborn, Deutschland, 2016
C. Baasch, G. Schmidt, U. Heute, A. Nebel, G. Deuschl
- Stimmtherapie für Parkinsonsprache: Akustische Analyse der Wirksamkeit, ESSV 2016, Leipzig, Deutschland, 2016
C. Baasch, W. Schmidt, G. Schmidt, U. Heute, A. Baumann, A. Nebel, G. Deuschl, T. von Eimeren
- Parkinson-Sprachanalyse - Erweiterungen zum Qualitätsmerkmal Formantdreieck, Proc. DAGA 2017, Kiel, Deutschland, 2017
C. Baasch, G. Schmidt, U. Heute, A. Nebel, G. Deuschl
- "Observations from a Simple Vocal-Tract-Model's Behaviour for PD-Dysarthric Speech: Applicability," Speech Communication; 13th ITG-Symposium, 2018, pp. 1-5
U. Heute, G. Schmidt
- Hörgeräte-basierte Parkinson-Sprachanalyse, Proc. DAGA 2018, München, Deutschland, 2018
F. Spitz, C. Baasch, G. Schmidt, U. Heute, A. Nebel, G. Deuschl
- Speech communication : 13. ITG-Fachtagung Sprachkommunikation : 10.-12. Oktober 2018 in Oldenburg. Berlin ; Offenbach : VDE VERLAG GMBH. (Informationstechnische Gesellschaft: ITG-Fachbericht ; 282)
U. Heute