Detailseite
Untersuchung der Interaktion zwischen gesprochener und geschriebener Sprache beim Sprachverstehen: Eine Fallstudie über Sentimentanalyse (A08#)
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2016 bis 2018
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 22956010
Ziel dieses Projekts ist die Erforschung der Interaktion zwischen verschiedenen Informationsebenen von gesprochener Sprache (nicht nur auf der Ebene der Phoneme sondern auch der Prosodie) und Text (z.B. Syntax) anhand von nicht-kanonischen (spontansprachlichen) Sprachdaten und ihr Effekt auf Sprachverstehenssysteme. Wir werden ein innovatives Framework ("focus listener") entwickeln und auf die Sentimentanalyse als Fallstudie anwenden. Das finale System wird auf deutschen politischen Radiointerviews evaluiert.Sprachverstehenssysteme (SLU) wurden oft so konzipert, dass die automatische Spracherkennung (ASR) und die maschinelle Sprachverarbeitung (NLP) separat gehandhabt werden (Issar and Ward, 1993; Wang et al., 2005; Mori et al., 2008; Tur and Mori, 2011). Trotzdem ist ihre Interaktion in verschiedenenen theoretischen Arbeiten detailliert dokumentiert. Beispielsweise ist die Interaktion zwischen Prosodie und automatisch von Texten ableitbaren Eigenschaften (z.B. Wortarten oder Syntax) und ihre gemeinsamen Auswirkungen auf die Semantik und die Informationstruktur (Gussenhoven, 1984; Ladd, 1996; Steinhauer, 1999; Gobl and Ni, 2003; Gussenhoven, 2004; Baumann and Grice, 2006; Grice and Baumann, 2007; Féry and Kügler, 2008; Büring, 2011; Reckling and Kügler, 2011; Büring, 2012). Dieses Projekt untersucht linguistische Informationen verschiedener Ebenen und ihre Interaktion im Rahmen der Sprachverstehensforschung, um die Antwort auf folgende Fragen zu finden: a) Was ist die Auswirkung der Kombination von syntaktischer Information und Prosodie auf die Segmentierung gesprochener Sprache in semantisch relevanten Einheiten wie Aussagen? b) Wie können wir die Modellierung von ASR- und NLP-Aufgaben wie Dependenzparsing mit Hilfe von Wort-Lattices für nicht-kanonische Sprachdaten zusammenführen? und c) Wie ist der Einfluss der Prosodie auf Sprachverstehensaspekte wie die Sentimentanalyse? Dementsprechened entwickeln wir eine innovative Architektur für Sprachverstehen ("focus listener"), in der alle Forschungsergebnisse zusammen integriert werden, um die Leistung des Sprachverstehensystems zu verbessern.Ein wichtiger Nebeneffekt dieses Forschungsprojekts ist es, state-of-the-art Technologie aus der automatischen Spracherkennung in das INF Projekt des SFB 732 einzuführen. Diese Komponente spielt eine wichtige Rolle, um die Forschung zu gesprochener Sprache und die Forschung zu Texten zusammenzuführen. Sie wird die Qualität der Transkriptionen (z.B. Erweiterung von nicht exakten Transkriptionen der Audiodaten auf detaillierte Annotationen inkl. Verzögerungen oder Fehlstarts des Sprechers) und die Quantität (z.B. ein erster Schritt zur Verwendung mit nicht-transkriptieren Daten) der "silver standard" - Daten für andere Projekte innerhalb des SFB 732 bereichern.
DFG-Verfahren
Sonderforschungsbereiche
Teilprojekt zu
SFB 732:
Inkrementelle Spezifikation im Kontext
Antragstellende Institution
Universität Stuttgart
Teilprojektleiter
Professor Dr. Ngoc Thang Vu