Detailseite
Segmentierung mündlicher Korpora
Antragsteller
Dr. Thomas Schmidt
Fachliche Zuordnung
Einzelsprachwissenschaften, Historische Linguistik
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2016 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 281693063
Seit Beginn der Auseinandersetzung mit Sprache in der Interaktion sind eine Reihe von Segmentierungsprinzipien für die gesprochene Sprache vorgeschlagen worden. Ein Segmentierungssystem, das sowohl theoretisch gut fundiert als auch für große und vielfältige Korpora mündlicher Sprache praktisch operationalisierbar ist, bleibt aber ein Desiderat. Dies schränkt gegenwärtig die Nutzbarkeit solcher Korpora für die linguistische Analyse, für die Sprachvermittlung, für kontrastive Studien und für die Entwicklung von Sprachtechnologie ein.Das vorliegende Projekt hat sich daher die Entwicklung einer Segmentierungsmethode zum Ziel gesetzt, die der Analyse von Interaktionsdaten auf verschiedenen Ebenen und für verschiedene Forschungszwecke angemessen ist. Das Vorhaben wird Ansätze zur Segmentierung aus der wissenschaftlichen Literatur zur Konversationsanalyse, interaktionalen Linguistik, Pragmatik und Korpuslinguistik auswerten und weiterentwickeln, indem es sie auf Auszüge dreier großer Korpusdatenbanken (CLAPI, ESLO bzw. FOLK) mit einer großen Bandbreite an Interaktionsdaten anwendet. Resultat wird ein systematischer Segmentierungsleitfaden sein, der über verschiedene Interaktionstypen und für französische wie deutsche Daten Verwendung finden kann.Das Vorhaben betritt Neuland, insofern es sich der Frage der Segmentierung mündlicher Daten zum ersten Mal auf der Grundlage einer großen, diversifizierten empirischen Basis und mit einer sprachübergreifenden Perspektive nähert. Die Ergebnisse des Projekts werden die Nutzbarkeit der drei Datenbanken verbessern, zu einer besseren Praxis der Arbeit mit mündlichen Korpora im Allgemeinen beitragen und zu einem besseren Verständnis der Strukturen mündlicher Interaktion führen. Das Projekt bearbeitet somit aktuelle Bedarfe in der Gesprächsforschung, der korpusbasierten Sprachvermittlung, der kontrastiven Linguistik des Französischen und Deutschen und in der Entwicklung von Sprachtechnologie für Interaktionsdaten.Methodisch nähert sich das Projekt seinem Gegenstand auf zwei unterschiedliche Weisen: 1) über einen qualitativen, mehrdimensionalen Zugang, der ebenenübergreifend Segmentierungsprobleme und -kriterien identifiziert und analysiert und 2) über einen quantitativen, eindimensionalen Zugang, in dem ausgewählte Typen möglicher Segmentierungspunkte automatisch identifiziert und von menschlichen Annotatoren hinsichtlich ihrer Relevanz für die Segmentierung klassifiziert werden. Beide Ansätze stützen sich zunächst auf ein Pilotkorpus, das für jede Sprache 10 Korpusausschnitte von je 10 Minuten enthält. Im Laufe des Projekts wird dieses Korpus auf 5 Stunden pro Sprache ausgeweitet. Kontrastive Aspekte werden von Beginn des Projekts an eine zentrale Rolle spielen.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
Frankreich
Mitverantwortlich
Professor Dr. Arnulf Deppermann
Kooperationspartnerin
Professorin Dr. Véronique Traverso