SFB 732: Inkrementelle Spezifikation im Kontext
Informatik, System- und Elektrotechnik
Zusammenfassung der Projektergebnisse
In Kooperationen zwischen den einzelnen Teilgebieten der Linguistik und Computerlinguistik untersuchte der SFB 732 über 12 Jahren hinweg eine Eigenschaft von sprachlichen Ausdrücken – und den Elementen, aus denen sie aufgebaut sind – die sich auf allen Ebenen der linguistischen Beschreibungen beobachten lässt: isoliert betrachtet sind die meisten Elemente ambig oder unterspezifiziert; werden sie jedoch zu größeren Komplexen zusammengefügt, so lösen sich die meisten Ambiguitäten auf. Sprachlaute, die a) verschiedene Phoneme realisieren können (z.B. unbetonte Vokale beim schnellen Sprechen) und/oder b) unterschiedliche prosodische Kategorien, erhalten durch die Verwendung im Rahmen einer bestimmten Äußerung ihre spezifische Interpretation; synkretistische morphologische Formen (wie sie = Fem. Sg. Nom./Akk. bzw. Pl. Nom./Akk.) werden im Satzgebrauch aufgrund der Syntax disambiguiert; die möglichen Lesarten eines deverbalen Nomens wie construction, das sich entweder auf ein Ereignis oder sein Ergebnis beziehen kann, werden durch Modifikatoren wie ongoing eingegrenzt; etc. Auf allen relevanten Beschreibungsebenen ist es der Kontext der Elemente, der zur Disambiguierungsentscheidung führt, und je mehr Informationen zur Verfügung stehen, desto enger wird die Auswahl der möglichen Zielinterpretationen. Wir beobachten also inkrementelle Spezifikation im Kontext. Jede Betrachtung eines Aspekts von Sprache(n) und von Sprachverarbeitung muss Mechanismen enthalten, um diese Schlüsseleigenschaft effektiven kommunikativen Austauschs zu beschreiben; ein vollständiges Verständnis der Interaktionen auf allen relevanten Ebenen jedoch ist bis heute eine der größten Herausforderungen für die Sprachforschung: Löst die Spezifizierung/Disambiguierung auf der einen Ebene Spezifizierungsentscheidungen auf anderer Ebene aus oder umgekehrt? Oder sollte man simultane Spezifizierungsentscheidungen annehmen? Indem der SFB 732 diesen Fragen für ein breites Spektrum von sprachlichen Elementen in großer Tiefe nachging, hat er unser systematisches Verständnis von Sprache(n) und Sprachverarbeitung bedeutend vorangebracht. Die Forschungsbeiträge reichen von theoretischen Fortschritten im Rahmen ganz unterschiedlicher Forschungsparadigmen über verbesserte sprachtechnologische Modelle und Methoden bis hin zu Datenressourcen wie Sprach- und Textkorpora und komputationellen Analysewerkzeugen.
Projektbezogene Publikationen (Auswahl)
2010. Discourse prominence and pe-marking in Romanian, International Review of Pragmatics 2(2), pp. 298-332
Chiriacescu, Sofiana & Klaus von Heusinger
2010. Multilevel Exemplar Theory. Cognitive Science 34, pp. 537-582
Walsh, Michael, Bernd Möbius, Travis Wade & Hinrich Schütze
2010. Number/Aspect Interactions in the Syntax of Nominalizations: A Distributed Morphology Approach. Journal of Linguistics 46.3, pp. 537-574
Alexiadou, Artemis, Gianina Iordachioaia & Elena Soare
2010. Syntactic and Semantic Constraints in the Formation and Interpretation of -ung-Nouns. In: Alexiadou, Artemis & Monika Rathert (eds). The Semantics of Nominalisations across Languages and Frameworks. Berlin, Mouton de Gruyter, pp 169-214
Roßdeutscher, Antje & Hans Kamp
2011. The case of accusative embedded subjects in Mongolian. Lingua, 121(1), pp. 48–59
von Heusinger, Klaus, Udo Klein & Dolgor Guntsetseg
2011. Underspecifying and Predicting Voice for Surface Realisation Ranking. In: The Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (ACL), pp. 1007–1017
Zarrieß Sina, Aoife Cahill & Jonas Kuhn
2012. A Discourse Information Radio News Database for Linguistic Analysis. In: Christian Chiarcos, Sebastian Nordhoff & Sebastian Hellmann, (eds) Linked Data in Linguistics. Representing and Connecting Language Data and Language Metadata, Heidelberg, Springer, pp. 65-75
Eckart, Kerstin, Arndt Riester & Katrin Schweitzer
2012. German specificity markers: ‘bestimmt’ vs. ‘gewiss’. In: Cornelia Ebert & Stefan Hinterwimmer (eds), Different kinds of specificity across languages, Studies in Linguistics & Philosophy. Berlin, Springer, pp. 31-74
Ebert, Christian, Cornelia Ebert & Stefan Hinterwimmer
2012. The passive of reflexive verbs and its implications for theories of binding and case. Journal of Comparative Germanic Linguistics 15, pp. 213-268
Schäfer, Florian
2013. Coreference, lexical givenness and prosody in German. Lingua 136, pp. 16-37
Baumann, Stefan & Arndt Riester
2013. Morphological and syntactic case in statistical dependency parsing. Computational Linguistics, pp. 23-55
Seeker, Wolfgang & Jonas Kuhn
2013. Sentiment Relevance. Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (ACL), pp. 954–963
Scheible, Christian & Hinrich Schütze
2014. Crosslingual and Multilingual Construction of Syntax-Based Vector Space Models. Transactions of the Association of Computational Linguistics, 2, pp. 245-258
Utt, Jason & Sebastian Padó
2014. Logical metonymy resolution in a words-as-cues framework: evidence from self-paced reading and probe recognition. Cognitive Science 38(5), pp. 973-996
Zarcone, Alessandra, Sebastian Padó & Alessandro Lenci
2014. Multiple determiners and the structure of DPs. John Benjamins
Alexiadou, Artemis
2015. A graph-based lattice dependency parser for joint morphological segmentation and syntactic analysis. Transactions of the Association of Computational Linguistics 3.1, pp. 359-373
Seeker, Wolfgang & Özlem Çetinoğlu
2015. Anarchy in the NP. When new nouns get deaccented and given nouns don't. Lingua 165(B), pp. 230-253
Riester, Arndt & Jörn Piontek
2015. Attention, please! - Expanding the GECO database. In: Proceedings of the International Congresses of Phonetic Sciences (ICPhS), Glasgow
Schweitzer, Antje, Natalie Lewandowski, Daniel Duran & Grzegorz Dogil
2015. Distributional vectors encode referential attributes. In: Proceedings of EMNLP, Lisbon, pp. 12-21
Gupta, Abhijeet, Gemma Boleda, Marco Baroni & Sebastian Padó
2015. Explaining the link between agentivity and non-culminating causation. In: Semantics and Linguistic Theory, vol. 25, pp. 246-266
Martin, Fabienne
2015. Exploring the relationship between intonation and the lexicon: Evidence for lexicalised storage of intonation. Speech Communication (66), pp. 65-81
Schweitzer, Katrin, Michael Walsh, Sasha Calhoun, Hinrich Schütze, Bernd Möbius, Antje Schweitzer & Grzegorz Dogil
2015. External arguments in transitivity alternations: a layering approach. Oxford, Oxford University Press
Alexiadou, Artemis, Elena Anagnostopoulou & Florian Schäfer
2015. Pluractionality with Lexically Cumulative Verbs: The Supine Nominalization in Romanian. Natural Language Semantics 23.4, pp. 307-352
Iordachioaia, Gianina & Elena Soare
2015. Using prosodic annotations to improve coreference resolution of spoken text. In Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics (ACL-IJCNLP), Beijing, pp. 83-88
Rösiger, Ina & Arndt Riester
2016. Contrastive topic constituents in German. Proceedings of Speech Prosody, Boston, pp. 345-349
Zerbian, Sabine, Giuseppina Turco, Nadja Schauffler, Margaret Zellers & Arndt Riester
2016. Distinguishing Literal and Non-Literal Usage of German Particle Verbs. In: Proceedings of the 15th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL- HLT), San Diego, pp. 353–362
Köper, Maximilian & Sabine Schulte im Walde
2016. How to train dependency parsers with inexact search for joint sentence boundary detection and parsing of entire documents. Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics, pp. 1924-1934
Björkelund, Anders, Agnieszka Faleńska, Wolfgang Seeker & Jonas Kuhn
2016. Joint information structure and discourse structure analysis in an Underspecified DRT framework. In: Julie Hunter, Mandy Simons & Matthew Stone (eds) Proceedings of the 20th Workshop on the Semantics and Pragmatics of Dialogue (JerSem), New Brunswick, pp. 15-24
Reyle, Uwe & Arndt Riester
2016. Learning to Make Inferences in a Semantic Parsing Task. In Transactions of the Association for Computational Linguistics, Vol 4, pp. 155-168
Richardson, Kyle & Jonas Kuhn
2016. Theta-head binding in the German locative alternation. In: Bade, Nadine, Polina Berezovskaya & Anthea Schöller (eds). Proceedings of Sinn und Bedeutung 20, University of Tübingen, September 2015, pp. 270-287
Geist, Ljudmila & Daniel Hole
2017. Complement Coercion: The Joint Effects of Type and Typicality. Frontiers in Psychology, 8
Zarcone, Alessandra, Ken McRae, Alessandro Lenci & Sebastian Padó
2017. Differential Object Marking of human definite direct objects in Romanian. Revue roumaine de linguistique 62(4), pp. 359-376
Onea, Edgar & Daniel Hole
2017. Evaluating Compound Splitters Extrinsically with Textual Entailment. Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (ACL), Vancouver, pp. 58–63
Jagfeld, Glorianna, Patrick Ziering & Lonneke van der Plas
2017. Integrating lexical-conceptual and distributional semantics: a case report. In: Proceedings of the Amsterdam Colloquium, Amsterdam, pp. 75-84
Pross, Tillmann, Antje Roßdeutscher, Gabriella Lapesa, Max Kisselew & Sebastian Padó
2018. Diachronic Usage Relatedness (DURel): A Framework for the Annotation of Lexical Semantic Change. In: Proceedings of the 16th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT), New Orleans, pp. 169–174
Schlechtweg, Dominik, Sabine Schulte im Walde & Stefanie Eckmann
2018. Disambiguation of newly derived nominalizations in context: A Distributional Semantics approach. Word Structure, 11(3), 315-350
Lapesa, Gabriella, Lea Kawaletz, Ingo Plag, Marios Andreou, Max Kisselew & Sebastian Padó
2018. Effects of Word Embeddings on Neural Network-based Pitch Accent Detection. In: Proceedings of Speech Prosody Conference, pp. 719-723
Stehwien, Sabrina, Ngoc Thang Vu & Antje Schweitzer
2018. German Radio Interviews: The GRAIN Release of the SFB732 Silver Standard Collection. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), pp. 2887-2895
Schweitzer, Katrin, Kerstin Eckart, Markus Gärtner, Agnieszka Falenska, Arndt Riester, Ina Rösiger, Antje Schweitzer, Sabrina Stehwien & Jonas Kuhn
2018. Lexico-acoustic Neural-based Models for Dialog Act Classification. In: Proceedings of the 43rd IEEE International Conference on Acoustics, Speech and Signal Processing, pp. 6194-6198
Ortega, Daniel & Ngoc Thang Vu
2018. What about lexical semantics if syntax is the only generative component of the grammar? A case study on word meaning in German. Natural Language and Linguistic Theory, 36
Pross, Tillmann