Detailseite
Projekt Druckansicht

Eine Computergestützte Untersuchung des Konstruktionslernprozesses

Antragstellerin Leonie Weißweiler
Fachliche Zuordnung Angewandte Sprachwissenschaften, Computerlinguistik
Förderung Förderung seit 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 556596361
 
Wie können wir Sprache studieren? Der einfachste Weg ist die Introspektion: Wir ziehen befragen unsere Muttersprachlerintuition dazu, welche Sätze akzeptabel sind, und versuchen dann, ein System zu entwickeln, das diese Intuition erklärt. Um datenorientiert vorzugehen, können wir Korpora von geäußerten Sätzen konsultieren und versuchen, Systeme zu entwickeln, die diese Sätze vorhersagen und keine anderen. So können wir versuchen, die Abstraktionen im menschlichen Geist, die diese Sätze hervorgebracht haben, auch ohne einen direkten Zugang zu erforschen. Eine Einschränkung besteht jedoch darin, dass die auf Beobachtungen und nicht auf Kausalität beruht. Die experimentelle Linguistik ermöglicht es, Hypothesen über die Sprachstruktur und den Spracherwerb direkt zu testen, indem Variablen manipuliert werden. Allerdings ist auch dieser Ansatz in einer kontrollierten Laborumgebung beschränkt. Mit dieser Methode können auch nur Änderungen vorgenommen werden können, indem Wörter zur Summe der Sprachdaten hinzugefügt werden, die ein Teilnehmer in seinem Leben bereits gesehen hat. Kausale Rückschlüsse, die möglich wären, wenn man etwas am gesamten Sprachinput eines Menschen ändern würde, sind durch die Menschenrechte untersagt. Wir können z. B. nicht sicherstellen, dass ein Kind niemals eine negative Rückmeldung zu einer Äußerung erhält. Sprachmodelle (LMs) bieten nun eine leistungsstarke Ergänzung zu diesem Instrumentarium und überwinden einige der früheren Einschränkungen. LMs scheinen in der Lage zu sein, komplexe sprachliche Strukturen aus Daten zu lernen, selbst wenn sie nur über geringe linguistische Kenntnisse verfügen. Sie sind für eine direkte kausale Intervention geeignet, da wir ihre Trainingsdaten manipulieren und den Einfluss auf das Lernen direkt messen können. Ich schlage daher vor, LMs als Stellvertreter für menschliches Lernen zu verwenden, um Hypothesen über die Prozesse des Spracherwerbs zu bilden. Konkret werde ich das kürzlich eingeführte BabyLM-Korpus verwenden, das erstellt wurde, um die Menge und die Art des gesamten Sprachinputs zu emulieren, den ein Teenager erhalten hat. Misra und Mahowald haben bereits gezeigt, dass das Erlernen der AANN-Konstruktion vom Vorhandensein von Sätzen abhängt, die mit Phänomenen kompatibel sind, die dieselben Kerneigenschaften aufweisen wie diese. In Zusammenarbeit mit Prof. Kyle Mahowald an der UT Austin werde ich diesen Ansatz nutzen, um eine Reihe von theoretisch begründeten Fragen zum Lernen seltener syntaktischer Konstruktionen zu testen, mit besonderer Konzentration darauf, welche Merkmale des Inputs für das Lernen erforderlich sind. Im zweiten Jahr werde ich mit Prof. Reut Tsarfaty an der Bar Ilan University zusammenarbeiten, um diesen Ansatz auf eine Vielzahl typologisch unterschiedlicher Sprachen auszudehnen und damit die Allgemeingültigkeit der Schlussfolgerungen, die wir ziehen können, sowie den Umfang der in diesem Bereich der Computerlinguistik betrachteten Sprachen zu erweitern.
DFG-Verfahren WBP Stipendium
Internationaler Bezug Israel, USA
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung