Methoden zur text-basierten Extraktion impliziter Relationen
Zusammenfassung der Projektergebnisse
Das Projekt befasste sich mit der Möglichkeit, Methoden der semantischen Analyse einzusetzen, um Relationen in Texten zu erkennen, die lediglich implizit und nur auf Basis von Schlussfolgerungen zu verstehen sind. Dabei war eine Grundannahme, dass Vorkommen bestimmter Rollenrealisierungen Aufschluss darüber geben können, welche impliziten Relationen sich über Satzgrenzen hinweg folgern lassen. Um das Projektziel erreichen zu können, wurden zunächst zwei Modelle zur besseren Analyse semantischer Rollen entwickelt. Im ersten Modell wurden diskurssemantische Erkenntnisse genutzt, um eine automatische Rollenzuweisung in Fällen zu ermöglichen, in denen traditionelle Methoden—welche ausschließlich auf der Ebene von Wort und Syntax arbeiten—aufgrund von satzinternen Ambiguitäten scheitern. In einem zweiten Modell wurde die Rollenzuweisung weiter verbessert, indem kompositionelle Eigenschaften von syntaktischen Strukturen genutzt und in die Modellierung miteinbezogen wurden. Der Nutzen beider Modelle wurde auf Basis mehrerer Standarddatensets gezeigt, in denen quantitative und qualitative Verbesserungen gegenüber dem vorherigen Stand der Forschung festgestellt wurden. Im Falle des zweiten Modells wurde darüber hinaus eine Anwendbarkeit in unterschiedlichen Sprachen und auf Basis verschiedener Rolleninventare demonstriert. Das Ziel des Projektes, implizite Relationen auf Basis von Rollenrealisierungen zu identifizieren, wurde aufgrund von datenbasierten Erkenntnissen angepasst. Ursprünglich war geplant, im Rahmen des Projektes implizite Relationen zwischen Entitäten festzustellen (z.B. aus „A hat drei Kinder“ und „B ist der älteste Sohn“ lässt sich „A ist der Vater von B“ folgern). Die Annahme, dass sich solche Relationen durch typische Rollenrealisierungsmuster bestimmen lassen, konnte jedoch nicht bestätigt werden. Im Laufe des Projektes wurde als neues Ziel die Erkennung von impliziten Relationen zwischen Ereignissen formuliert, da sich diese besser durch semantische Rollen charakterisieren lassen. Ein Prototypsystem, welches implizite Relationen auf Basis von Rollenmustern klassifiziert, wurde erfolgreich umgesetzt. Dieses System, als auch die zunächst entwickelten Modelle zur verbesserten Analyse semantischer Rollen, wurden im Rahmen internationaler Fachtagungen veröffentlicht. Über das ursprüngliche Projektziel hinaus habe ich mehrere organisatorische Beiträge zum fachlichen Gesamtbild leisten können. Im Zuge der zweiten von mir organisierten Arbeitstagung habe ich außerdem ein gemeinsames Evaluierungsprogramm mit durchgeführt, um den Nutzen aktueller Modelle zum automatischen Sprachverstehen extrinsisch zu testen. Die im Rahmen dieser Arbeit entstandenen Modelle kamen bereits in mehreren internationalen Forschungsprojekten zur Anwendung. Unter anderem werden sie auch in eigenen Folgearbeiten eingesetzt.
Projektbezogene Publikationen (Auswahl)
- (2015). Context-aware Frame-Semantic Role Labeling. Transactions of the Association for Computational Linguistics 3:449-460
Roth, Michael, Mirella Lapata
(Siehe online unter https://doi.org/10.1162/tacl_a_00150) - (2016). Neural semantic role labeling with dependency path embeddings. In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics, Berlin, Germany, August, pp. 1192-1202
Roth, Michael, Mirella Lapata
- (2017). Aligning script events with narrative texts. In Proceedings of the Sixth Joint Conference on Lexical and Computational Semantics, Vancouver, Canada, August, pp. 128-134
Ostermann, Simon, Michael Roth, Stefan Thater, Manfred Pinkal
- (2017). Role semantics for better models of implicit discourse relations. In Proceedings of the 12th international Conference on Computational Semantics, Montpellier, France, to appear
Roth, Michael