Project Details
Projekt Print View

Kausalitätsmarker als Kohärenzmittel und ihre Formalisierung für die automatische Textanalyse

Subject Area General and Comparative Linguistics, Experimental Linguistics, Typology, Non-European Languages
Term from 2006 to 2009
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 25800922
 
Verfahren der automatischen Textanalyse haben sich in den letzten 15 Jahren vorwiegend mit statistischen und selbstlernenden Methoden beschäftigt, etwa für Anwendungen der Informationsextraktion, des question answering oder der automatischen Textzusammenfassung. Unser Vorhaben geht von der These aus, dass diese oberflächennahe Verarbeitung mittlerweile an ihre Grenzen gestoßen ist. Wir streben daher an, Erkenntnisse der linguistischen Analyse wieder verstärkt für computerlinguistische Anwendungen nutzbar zu machen. Insbesondere soll eine Verbindung zwischen empirischen, korpusbasierten Arbeiten und ihrer computerlinguistischen Implementierung geschaffen werden. Die linguistische Fragestellung, anhand derer dieses methodische Ziel verfolgt werden soll, betrifft sprachliche Mittel der kausalen Kohärenzstiftung (Kausalitätsmarker): Untersucht werden Konnektoren wie weil, da, denn, sodass und deshalb, kausal interpretierbare Präpositionen wie wegen, infolge, durch und aus, Substantive wie Ursache, Folge, Wirkung sowie verbale Einheiten wie verursachen oder zur Folge haben. Die Untersuchung stützt sich auf ein Korpus von Kommentartexten. Die Marker sollen inventarisiert, hinsichtlich Syntax, Semantik, Informationsstruktur analysiert und ihr Beitrag zur Textkohärenz formalisiert werden. Die Ergebnisse sollen in die computerlinguistische Nutzung einmünden, die damit in die Lage versetzt wird, zusätzlich zu statistischen Informationen wieder verstärkt qualitative Informationen auszuwerten. Es wird ein prototypischer Diskursparser entwickelt, der Informationen aus Kausalitätsmarkern verarbeitet und unterspezifizierte Textstrukturen generiert. Die Erträge des Projektes können in einem späteren Schritt (außerhalb des hier beantragten Vorhabens) in Computeranwendungen für Aufgaben der automatischen Textzusammenfassung genutzt werden.
DFG Programme Research Grants
 
 

Additional Information

Textvergrößerung und Kontrastanpassung