Detailseite
Kausalitätsmarker als Kohärenzmittel und ihre Formalisierung für die automatische Textanalyse
Antragstellerinnen / Antragsteller
Professorin Dr. Eva Breindl-Hiller; Professor Dr. Manfred Stede
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2006 bis 2009
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 25800922
Verfahren der automatischen Textanalyse haben sich in den letzten 15 Jahren vorwiegend mit statistischen und selbstlernenden Methoden beschäftigt, etwa für Anwendungen der Informationsextraktion, des question answering oder der automatischen Textzusammenfassung. Unser Vorhaben geht von der These aus, dass diese oberflächennahe Verarbeitung mittlerweile an ihre Grenzen gestoßen ist. Wir streben daher an, Erkenntnisse der linguistischen Analyse wieder verstärkt für computerlinguistische Anwendungen nutzbar zu machen. Insbesondere soll eine Verbindung zwischen empirischen, korpusbasierten Arbeiten und ihrer computerlinguistischen Implementierung geschaffen werden. Die linguistische Fragestellung, anhand derer dieses methodische Ziel verfolgt werden soll, betrifft sprachliche Mittel der kausalen Kohärenzstiftung (Kausalitätsmarker): Untersucht werden Konnektoren wie weil, da, denn, sodass und deshalb, kausal interpretierbare Präpositionen wie wegen, infolge, durch und aus, Substantive wie Ursache, Folge, Wirkung sowie verbale Einheiten wie verursachen oder zur Folge haben. Die Untersuchung stützt sich auf ein Korpus von Kommentartexten. Die Marker sollen inventarisiert, hinsichtlich Syntax, Semantik, Informationsstruktur analysiert und ihr Beitrag zur Textkohärenz formalisiert werden. Die Ergebnisse sollen in die computerlinguistische Nutzung einmünden, die damit in die Lage versetzt wird, zusätzlich zu statistischen Informationen wieder verstärkt qualitative Informationen auszuwerten. Es wird ein prototypischer Diskursparser entwickelt, der Informationen aus Kausalitätsmarkern verarbeitet und unterspezifizierte Textstrukturen generiert. Die Erträge des Projektes können in einem späteren Schritt (außerhalb des hier beantragten Vorhabens) in Computeranwendungen für Aufgaben der automatischen Textzusammenfassung genutzt werden.
DFG-Verfahren
Sachbeihilfen